Re: script gesucht: Zellen aus html tabelle auslesen
- To: debian-kde@lists.debian.org
- Subject: Re: script gesucht: Zellen aus html tabelle auslesen
- From: Knoller Stocker Martin & Pia Stocker mit Marvin und Andreina <stocker.knoller@freesurf.ch>
- Date: Sat, 30 Oct 2004 23:47:30 +0200
- Message-id: <200410302347.30475.stocker.knoller@freesurf.ch>
- In-reply-to: <200410302030.i9UKUTGk025025@nsuncom.rz.hu-berlin.de>
- References: <200410301509.31522.stocker.knoller@freesurf.ch> <200410301739.48604.stocker.knoller@freesurf.ch> <200410302030.i9UKUTGk025025@nsuncom.rz.hu-berlin.de>
> > Mein script muss irgendwie die Tabellen-Zeile mit dem Eintrag "Vegi"
> > finden, und dann zum Bsp. die erste Spalte auslesen, oder die zweite
> > etc...
>
> Also de facto alle, die vegetarische Gerichte enthalten: tatsächlich hast
> du ja wohl noch tags wie <td>boeses Schweinefleisch</td> die du nicht
> matchen willst. Man bräuchte für RegExes eine Liste mit erwünschten (oder
> wahlweise unerwünschten) Strings. Das kann ich mir jetzt nur so
> vorstellen, dass in allen Vegi tags z.B. 'gemuese' vorkommt, oder
> 'fleisch' in allen unerwünschten. Oder man macht eine Datei mit, sagen
> wir, erwünschten, und dann grep -f (wie geht das in perl?)
nicht ganz, ich weiss, dass es immer genau eine zeile mit vegetarischen
gerichten gibt, dies will ich auslesen, aber nur die spalte des aktuellen
Tages: also sowas wie , hol mir das heutige vegi-menu vom restaurant x
und das heutige vegi-menu von restaurant y. oder noch kuerzer:
zeig mir die heutigen vegi-menus meiner bevorzugten restaurants an...
mit
grep -B 1 -A 12 Vegi Menu.htm
hole ich ungefaehr die passende Zeile raus.
in Zeile 1 steht immer <tr>
in Zeile 2 der Vegi-Header,
und dann die tabellen-spalten pro wochentag.
dann weiter mit:
grep -B 1 -A 12 Vegi Menu.htm | head -4 | tail -1
und dann haette ich die 2te Spalte (in diesem Falle Dienstag). Aber leider
koennen sich die Spalten-Eintrage ueber mehrer Zeilen erstrecken ...
wie merkt mein skript denn das?
am schluss muesste ich noch sed drueber laufen lassen um die html-tags
rauszuschmeissen
Reply to: