Bernhard Marx schrieb:
Michael Hierweck <team@edv-serviceteam.net> writes:gibt es ein Tool, ähnlich wie tidy, welche HTML in XHMTL transformiert und alle Formatierung verwirft, so dass wirklich nur "Struktur"-Tags übrig bleiben?
[...]
# "ü" that is "ue" seems to appear as: ü, s/ü/ü/g
Das "ü" ist ein "ü" -- nur versteckt es sich in Deiner ISO-8859-1 Umgebung, da es offenbar UTF-8 kodiert ist. Ein beherztes "recode UTF-8..ISO-8859-1 foo.html" unter beachtung der in der Datei eventuell angegebenen Kodierung vor oder nach dem tidy sollte Dir das gewurstel mit sed ersparen und auch vor € à µ ø et Co. nicht kapitulieren.
-billy. -- Meisterbohne Küfner, Mekle, Meier GbR Tel: +49-731-399 499-0 eLösungen Söflinger Straße 100 Fax: +49-731-399 499-9 89077 Ulm http://www.meisterbohne.de/