[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: script gesucht: Zellen aus html tabelle auslesen




----------  Weitergeleitete Nachricht  ----------

Subject: Re: script gesucht: Zellen aus html tabelle auslesen
Date: 2004 - Oktober - Samstag, 30. 23.47
From: Knoller Stocker Martin & Pia Stocker mit Marvin und Andreina 
<stocker.knoller@freesurf.ch>
To: debian-kde@lists.debian.org

> > Mein script muss irgendwie die Tabellen-Zeile mit dem Eintrag "Vegi"
> > finden, und dann zum Bsp. die erste Spalte auslesen, oder die zweite
> > etc...
>
> Also de facto alle, die vegetarische Gerichte enthalten: tatsächlich hast
> du ja wohl noch tags wie <td>boeses Schweinefleisch</td> die du nicht
> matchen willst. Man bräuchte für RegExes eine Liste mit erwünschten (oder
> wahlweise unerwünschten) Strings. Das kann ich mir jetzt nur so
> vorstellen, dass in allen Vegi tags z.B. 'gemuese' vorkommt, oder
> 'fleisch' in allen unerwünschten. Oder man macht eine Datei  mit, sagen
> wir, erwünschten, und dann grep -f (wie geht das in perl?)

nicht ganz, ich weiss, dass es immer genau eine zeile mit vegetarischen
gerichten gibt,  dies will ich auslesen, aber nur die spalte des aktuellen
Tages: also sowas wie , hol mir das heutige vegi-menu vom restaurant x
und das heutige vegi-menu von restaurant y. oder noch kuerzer:
zeig mir die heutigen vegi-menus meiner bevorzugten restaurants an...

mit

grep -B 1 -A 12 Vegi Menu.htm

hole ich ungefaehr die passende Zeile raus.
in Zeile 1 steht immer <tr>
in Zeile 2 der Vegi-Header,
und dann die tabellen-spalten pro wochentag.
dann weiter mit:

grep -B 1 -A 12 Vegi Menu.htm | head -4 | tail -1

und dann haette ich die 2te Spalte (in diesem Falle Dienstag). Aber leider
koennen sich die Spalten-Eintrage ueber mehrer Zeilen erstrecken ...

wie merkt mein skript denn das?
am schluss muesste ich noch sed drueber laufen lassen um die html-tags
rauszuschmeissen

-------------------------------------------------------



Reply to: