[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

UTF-8 wieder in 1 Byte Zeichen wandeln



Hallo in die Runde,

ich möchte aus Zeichen die einem 1 Byte Zeichensatz entstammen, aber
als UTF-8 gespeichert wurden, wieder in den 1 Byte Zeichensatz
wandeln.

Zum besseren Verständnis hier folgendes Beispiel:
Ich unterhalte mich per ICQ mit jemandem unterhalten der auf seinen
PC als Zeichensatz kyrillisch Windows-1251 verwendet. Wenn er
etwas schreibt, dann kann ich das erstmal nicht lesen. Also markier
ich den Text, speichere ihn in einer Datei und schau die mir
im Galeon mit Windows-1251 an. Das ist umständlich, geht aber.
Da Gaim allerdings ein Log mitschreibt könnte ich ja gleich das
verwenden. Nur speichert Gaim das natürlich im UTF-8. 

Hier meine Frage: Wie bekomme ich aus dem Log die UTF-8 Zeichen
wieder als Windows-1251 heraus? Möglichst etwas was sich scripten
lässt.

Ich hoffe es versteht jemand was ich meine. Wenn ich mir das Logfile
mit gedit anschaue, dann sehen die nicht lesbaren Zeichen genauso aus
wie die, die ich mit Cut'n'Paste gespeichert habe.

Hier mal die Ausgabe von hd, einer Textstelle, um zu vermeiden das die
Zeichen hier nochmal irgendwo gewandelt werden. 

cut-n-paste als Windows 1251
00000000  e2 20 ea e0 ea ee ec 20  e8 ed f1 f2 e8 f2 f3 f2
00000010  e5 0a 0a

aus dem Log in UTF-8
00000000  c3 a2 20 c3 aa c3 a0 c3  aa c3 ae c3 ac 20 c3 a8
00000010  c3 ad c3 b1 c3 b2 c3 a8  c3 b2 c3 b3 c3 b2 c3 a5
00000020  0a

Frank
-- 



Reply to: