[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

[Debian] Textstellen löschen



Moin,

ich habe hier ein Abiword Dokument, was nicht mehr eingelesen werden
kann. Leider sagt mir Abiword nicht, an welcher Stelle der Lesefehler
auftritt. Nun möchte ich zumindest den Text retten. Ich habe mir mal das
doc Format von Abiword angesehen, scheint eine HTML ähnliche Syntax zu
haben, die Tags sind zwischen < und > geklammert. Da der Text zielmlich
lang ist (ca. 40 Seiten, vielleicht ist das auch einfach zuviel für
Abiword), wäre das löschen der Tags per Hand ziemlich aufwendig. Gib's
es eine Lösung z.B. mit dem sed, der alle Zeichen zwischen < und >
einschließlich dieser Zeichen löscht? Meine eigenen Versuche sind
fehlgeschlagen:

sed "s/<*>//g" -> löscht nur die letzte ">"

Grüße, Sven

--
-----------------------------------------------------------
Um sich aus der Liste auszutragen schicken Sie bitte eine
E-Mail an debian-user-de-request@lehmanns.de die im Subject
"unsubscribe <deine_email_adresse>" enthaelt.
Bei Problemen bitte eine Mail an: Jan.Otto@Lehmanns.de
-----------------------------------------------------------

675 eingetragene Mitglieder in dieser Liste.


Reply to: