Re: windows to utf8
"Tepperis-von der Ohe, Michael" <Michael.Tepperis-von.der.Ohe@logicacmg.com> writes:
> wie/womit ermittel ich die codierung eines files?
Da hilft, glaube ich, nur Heuristik.
1) Wenn du Zugriff auf das System hast, auf dem die Datei erzeugt
wurde, sollte es am einfachsten sein, dessen Konfiguration als
ziemlich wahrscheinlichen Anhaltspunkt zu wählen.
2) Mozilla hat seit ein paar Jahren einen Algorithmus eingebaut, der
angeblich recht zuverlässig arbeitet. Ich glaube aber nicht, dass
der entsprechende Code auch standalone zu haben ist.
3) Ich habe bei der Umstellung eines Servers ein kleines
Python-Schnippsel geschrieben (das nicht mehr existiert), das
versucht hat, die Kodierung von ziemlich vielen Dateinamen zu
erraten (einfach eine Dekodierung auf den String anwenden und
schauen, ob es Fehler gibt; leider war die Reihenfolge der
Kodierungen, die ich für möglich hielt ungeschickt gewählt ... 8-).
Das ging zienlich in die Hosen, hat n'mir aber zumindest gezeigt,
dass der Umgang mit Codecs in Python ziemlich einfach ist ;-).
cheers,
andreas
Reply to: