[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: TRansformation von HTML in XHTML



Bernhard Marx schrieb:

Michael Hierweck <team@edv-serviceteam.net> writes:
gibt es ein Tool, ähnlich wie tidy, welche HTML in XHMTL transformiert
und alle Formatierung verwirft, so dass wirklich nur "Struktur"-Tags
übrig bleiben?

[...]

# "ü" that is "ue" seems to appear as: ü,
s/ü/ü/g

Das "ü" ist ein "ü" -- nur versteckt es sich in Deiner ISO-8859-1 Umgebung, da es offenbar UTF-8 kodiert ist. Ein beherztes "recode UTF-8..ISO-8859-1 foo.html" unter beachtung der in der Datei eventuell angegebenen Kodierung vor oder nach dem tidy sollte Dir das gewurstel mit sed ersparen und auch vor € à µ ø et Co. nicht kapitulieren.

-billy.



--
Meisterbohne   Küfner, Mekle, Meier GbR       Tel: +49-731-399 499-0
   eLösungen   Söflinger Straße 100           Fax: +49-731-399 499-9
               89077 Ulm                 http://www.meisterbohne.de/



Reply to: