[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: Wget cURL scheitern am HDHomeRun



Joachim Hartmann schrieb:
> 
> Am 25.04.2020 um 20:37 schrieb Richard Kraut:
> > ... für mich sieht das so aus, als ob da ein Script (PHP, JavaScript, CGI)
> > ausgeführt wird, welches dann die generierten Links in die Seite einbaut.
> >
> >
> das hast du richtig erkannt! Konkret scheint es sich um Javascript zu
> handeln.
> 
Z.B. mit scrapy (Paket python3-scrapy) duerfte man auch in der 
Konsole an die Daten rankommen:
https://docs.scrapy.org/en/latest/topics/dynamic-content.html

Gibt aber auch noch einige andere scraping-tools die auch mit 
Javascript klar kommen:
https://www.google.com/search?q=scraping+javascript

Vielleicht reicht es aber auch das in der website eingebundene 
Javascript oder eventuell auch eine JSON-Datei runterzuladen 
und die Daten da raus zu holen. Am besten mal z.B. in Firefox
in der Netzwerkanalyse (Strg-Umschalt+E) schauen was beim laden
der Webseite denn so gezogen wird.

Kurz mal in google geschaut:

Channel List. The list of available channels can be queried using 
the following URLs: 
http://<device ip>/lineup.json 
http://<device ip>/lineup.xml

Und wech,
Manne


Reply to: