[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: mit wget html inhalte in csv



niels jende <niels_jende@gi24.de> wrote:

> Hallo Frank,
>
> Frank Küster schrieb:
>>
>>
>> Also brauchen wir einen Converter.  Gibt es denn einen, wenn die Datei
>> bereits geholt wurde?
>>   
>>   
>
> Ja, es scheint als ob es einen gibt, ich habe nur das Script gefunden. 
> Ich will es damit mal nachher probieren; hier mla der Link
>
> http://sebsauvage.net/python/html2csv.py

Aha, du willst also die Tabellen in der html-Datei konvertieren, ja? 

>> Das Problem ist nicht die Kombination mit wget.  Aber solange niemand
>> weiß, wie man es überhaupt machen soll, ist es schwer, dieses Unbekannte
>> mit wget zu verheiraten.
>>
>>   
>
> Das wird glaube ich ganz schön schwierig; wenn es nicht geht - geht's
> halt nicht :-(

Äh, das Kombinieren ist trivial, nur das Abschneiden von
<protocol>://servername/ ist etwas tricky:

#!/bin/sh

url="$1"
filename=`basename ${url#*://*/}`

wget $url
html2csv $filename

Gruß, Frank
-- 
Frank Küster
Single Molecule Spectroscopy, Protein Folding @ Inst. f. Biochemie, Univ. Zürich
Debian Developer (teTeX)



Reply to: