[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: windows to utf8



"Tepperis-von der Ohe, Michael" <Michael.Tepperis-von.der.Ohe@logicacmg.com> writes:

> wie/womit ermittel ich die codierung eines files?

Da hilft, glaube ich, nur Heuristik.

1) Wenn du Zugriff auf das System hast, auf dem die Datei erzeugt
   wurde, sollte es am einfachsten sein, dessen Konfiguration als
   ziemlich wahrscheinlichen Anhaltspunkt zu wählen.

2) Mozilla hat seit ein paar Jahren einen Algorithmus eingebaut, der
   angeblich recht zuverlässig arbeitet.  Ich glaube aber nicht, dass
   der entsprechende Code auch standalone zu haben ist.

3) Ich habe bei der Umstellung eines Servers ein kleines
   Python-Schnippsel geschrieben (das nicht mehr existiert), das
   versucht hat, die Kodierung von ziemlich vielen Dateinamen zu
   erraten (einfach eine Dekodierung auf den String anwenden und
   schauen, ob es Fehler gibt; leider war die Reihenfolge der
   Kodierungen, die ich für möglich hielt ungeschickt gewählt ... 8-).
   Das ging zienlich in die Hosen, hat n'mir aber zumindest gezeigt,
   dass der Umgang mit Codecs in Python ziemlich einfach ist ;-).


cheers,

andreas



Reply to: