[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: script gesucht: Zellen aus html tabelle auslesen



> > Mein script muss irgendwie die Tabellen-Zeile mit dem Eintrag "Vegi"
> > finden, und dann zum Bsp. die erste Spalte auslesen, oder die zweite
> > etc...
>
> Also de facto alle, die vegetarische Gerichte enthalten: tatsächlich hast
> du ja wohl noch tags wie <td>boeses Schweinefleisch</td> die du nicht
> matchen willst. Man bräuchte für RegExes eine Liste mit erwünschten (oder
> wahlweise unerwünschten) Strings. Das kann ich mir jetzt nur so
> vorstellen, dass in allen Vegi tags z.B. 'gemuese' vorkommt, oder
> 'fleisch' in allen unerwünschten. Oder man macht eine Datei  mit, sagen
> wir, erwünschten, und dann grep -f (wie geht das in perl?)

nicht ganz, ich weiss, dass es immer genau eine zeile mit vegetarischen 
gerichten gibt,  dies will ich auslesen, aber nur die spalte des aktuellen
Tages: also sowas wie , hol mir das heutige vegi-menu vom restaurant x
und das heutige vegi-menu von restaurant y. oder noch kuerzer:
zeig mir die heutigen vegi-menus meiner bevorzugten restaurants an...

mit

grep -B 1 -A 12 Vegi Menu.htm 

hole ich ungefaehr die passende Zeile raus.
in Zeile 1 steht immer <tr>
in Zeile 2 der Vegi-Header,
und dann die tabellen-spalten pro wochentag. 
dann weiter mit:

grep -B 1 -A 12 Vegi Menu.htm | head -4 | tail -1

und dann haette ich die 2te Spalte (in diesem Falle Dienstag). Aber leider
koennen sich die Spalten-Eintrage ueber mehrer Zeilen erstrecken ...

wie merkt mein skript denn das?
am schluss muesste ich noch sed drueber laufen lassen um die html-tags
rauszuschmeissen



Reply to: