Re: mit wget html inhalte in csv
niels jende <niels_jende@gi24.de> wrote:
> Hallo Frank,
>
> Frank Küster schrieb:
>>
>>
>> Also brauchen wir einen Converter. Gibt es denn einen, wenn die Datei
>> bereits geholt wurde?
>>
>>
>
> Ja, es scheint als ob es einen gibt, ich habe nur das Script gefunden.
> Ich will es damit mal nachher probieren; hier mla der Link
>
> http://sebsauvage.net/python/html2csv.py
Aha, du willst also die Tabellen in der html-Datei konvertieren, ja?
>> Das Problem ist nicht die Kombination mit wget. Aber solange niemand
>> weiß, wie man es überhaupt machen soll, ist es schwer, dieses Unbekannte
>> mit wget zu verheiraten.
>>
>>
>
> Das wird glaube ich ganz schön schwierig; wenn es nicht geht - geht's
> halt nicht :-(
Äh, das Kombinieren ist trivial, nur das Abschneiden von
<protocol>://servername/ ist etwas tricky:
#!/bin/sh
url="$1"
filename=`basename ${url#*://*/}`
wget $url
html2csv $filename
Gruß, Frank
--
Frank Küster
Single Molecule Spectroscopy, Protein Folding @ Inst. f. Biochemie, Univ. Zürich
Debian Developer (teTeX)
Reply to: