UTF-8 wieder in 1 Byte Zeichen wandeln
Hallo in die Runde,
ich möchte aus Zeichen die einem 1 Byte Zeichensatz entstammen, aber
als UTF-8 gespeichert wurden, wieder in den 1 Byte Zeichensatz
wandeln.
Zum besseren Verständnis hier folgendes Beispiel:
Ich unterhalte mich per ICQ mit jemandem unterhalten der auf seinen
PC als Zeichensatz kyrillisch Windows-1251 verwendet. Wenn er
etwas schreibt, dann kann ich das erstmal nicht lesen. Also markier
ich den Text, speichere ihn in einer Datei und schau die mir
im Galeon mit Windows-1251 an. Das ist umständlich, geht aber.
Da Gaim allerdings ein Log mitschreibt könnte ich ja gleich das
verwenden. Nur speichert Gaim das natürlich im UTF-8.
Hier meine Frage: Wie bekomme ich aus dem Log die UTF-8 Zeichen
wieder als Windows-1251 heraus? Möglichst etwas was sich scripten
lässt.
Ich hoffe es versteht jemand was ich meine. Wenn ich mir das Logfile
mit gedit anschaue, dann sehen die nicht lesbaren Zeichen genauso aus
wie die, die ich mit Cut'n'Paste gespeichert habe.
Hier mal die Ausgabe von hd, einer Textstelle, um zu vermeiden das die
Zeichen hier nochmal irgendwo gewandelt werden.
cut-n-paste als Windows 1251
00000000 e2 20 ea e0 ea ee ec 20 e8 ed f1 f2 e8 f2 f3 f2
00000010 e5 0a 0a
aus dem Log in UTF-8
00000000 c3 a2 20 c3 aa c3 a0 c3 aa c3 ae c3 ac 20 c3 a8
00000010 c3 ad c3 b1 c3 b2 c3 a8 c3 b2 c3 b3 c3 b2 c3 a5
00000020 0a
Frank
--
Reply to: