[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: odt-Dateien per Skript bearbeiten



Klaus Becker schrieb am 06. Oct um 21:43 Uhr:
> Le Dienstag 06 Oktober 2015, 21:37:30 Christoph Schmees a écrit :
> > Am 06.10.2015 um 20:02 schrieb Klaus Becker:

> > > n'Abend,
> > > 
> > > ich kopiere öfters Webseiten in Writer, um sie dort fürs drucken zu
> > > bearbeiten.  Manchmal ist die Datei recht umfangreich, und es ist
> > > mühselig, sie innerhalb von LibreOffice aufzuarbeiten.
> > > 
> > > Es geht mir darum, Bilder zu entfernen, mehrfache Leerzeilen zu
> > > löschen und eventuell andere unnütze Partien.
> > > 
> > > Ich dekomprimiere die odt-Datei, bearbeite content.xml und
> > > komprimiere alles wieder zu einer odt-Datei. Versucht habe ich es
> > > z. B. mit folgenden sed-Befehlen:
> > > 
> > > # löscht Zeilenvorschub (?)
> > > sed -i 's#<text:line-break/>##g' content.xml

ungewöhnlich

> > > Das klappt mehr oder weniger bei kleinen Testdateien, funktionniert
> > > aber nicht mit grösseren realen Dateien.  Ich frage mich inzwischen,
> > > ob meine Vorgehensweise angebracht ist, und ob so etwas überhaupt mit
> > > sed möglich ist.
> > > 
> > > Vielleicht hat jemand einen Rat für mich?

xml Dateien musst du mit XML Tools bearbeiten, der einzige Weg um zu
erreichen, dass die XML Datei syntaktisch korrekt bleibt bzw wird.
Und ohne Syntax ist mit XML nichts.

Darüber hinaus willst du im odt Format bleiben. Es gibt also noch eine
Schema-Datei, die du berücksichtigen musst.

Da müsstest du dich einarbeiten.

Ersatzweise gibt es _vielleicht_ spezielle Tools zum Bearbeiten von
ODT-Dateien. Keine Ahnung. Ich erledige die von dir beschriebene Aufgabe
immer zu Fuss im Libreoffice, jede Website ist sowieso anders.

Gruß
Christian

-- 
Christian Knoke            * * *            http://cknoke.de
* * * * * * * * *  Ceterum censeo Microsoft esse dividendum.


Reply to: