[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: sed



On 24.08.06 20:51:25, Klaus Becker wrote:
> Am Donnerstag 24 August 2006 20:44 schrieb Klaus Becker:
> > Am Donnerstag 24 August 2006 20:33 schrieb Mathias Brodala:
> > > Hallo Klaus.
> > >
> > > > […] ich will nicht
> > > > Zeilen nuùerieren, sondern Absätze einer html-Datei, die durch
> > > > <ul></ul> eingeschlossen sind.
> > >
> > > Warum verwendest du dann nicht das ol-Element?
> >
> > Darauf bin ich nicht gekommen, weil das zu einfach war. Danke für den Tip!
> 
> Ich hab' mich zu früh gefreut. Mit <ol> wird die Datei zwar durchnumeriert, 
> aber in der Datei stehen die Zahlen nicht, sie erscheinen nur im Browser.
> 
> Mein Ziel ist, die Reihenfolge von Absätzen in einer html-Datei umzukehren, 
> das geht so also leider nicht. Scheint nicht so leicht zu sein.

Dann rate ich dir dazu dich in eine Programmiersprache mit HTML Parser
einzuarbeiten. Python waere mein persoenlicher Favorit (+lxml fuer den
Parser), aber Perl oder Ruby tun's sicher auch. Der wandelt dir das HTML
in einen Baum und du kannst dann bequem die Elemente umsortieren. Anders
wird das nur funktionieren wenn du das nur in diesem einen Dokument
machst, beim naechsten Dokument das vllt. etwas anders aussieht klappt
dann wieder nix.

HTML kann man nicht mit Regex&Co parsen, jedenfalls nicht im Allgemeinen
Fall.

Andreas

-- 
Tomorrow will be cancelled due to lack of interest.



Reply to: