Dirk Salva <dsalva@nutrimatic.ping.de> (Mo 07 Okt 2013 17:14:41 CEST): > On Mon, Oct 07, 2013 at 04:22:31PM +0200, Peter Funk wrote: > > Weil E4, F6 und FC die Codes für ä, ö und ü in > > iso8859-1 sind, speichert Dein "joe" seine Dateien > > offenbar in diesem Codeset und nicht in UTF-8 ab. > > Aha, danke. Was mich nur wundert ist, dass es keine Art > "Fallback-Anzeige" gibt. Bisher dachte ich immer, iso8859-1 ist in > UTF-8 inkludiert und kann somit auf UTF-8-Geräten angezeigt werden. Na, > hab ich mich wohl getäuscht. ASCII definiert alles was die Bytewerte von 0x00 bis 0x7f hat. ISO8859-1 beinhaltet ASCII und definiert dann noch die Bytewerte 0x80 bis 0xff. UTF-8 ist eine Möglichkeit, Unicode zu kodieren. Unicode benutzt „Codepoints“ von derzeit 0x0000 bis 0x10ffff, oder in der Unicode-Schreibweise als U+0000 bis U+10FFFF - für die derzeit standardisierten Zeichen.. Diese Codepoints werden nun in verschiedener Weise kodiert. Zum Beispiel hat das „A“ den Codepoint 0x41, was „zufällig“ dem „A“ aus dem ASCII und ISO8859-* Zeichensätzen entspricht. Da bietet sich eine Kodierung an, in der das „A“ auch nur ein Byte belegt. Das macht pure ASCII-Texte zufällig kompatibel zur UTF-8-Kodierung von Unicode. Nehmen wir das Ö: ASCII kennt das nicht ISO8850-1 kodiert es als 0xD6 , lt. iso_889-1(7) UTF-8 als 0xC396, der Unicode-Codepoint dafür ist U+00D6. Kann alles falsch sein, ist nur so dargestellt, wie ich es nach dem Studium der Wikipedia und verschiedenen Selbstexperimenten festgestellt habe. Best regards from Dresden/Germany Viele Grüße aus Dresden Heiko Schlittermann -- SCHLITTERMANN.de ---------------------------- internet & unix support - Heiko Schlittermann, Dipl.-Ing. (TU) - {fon,fax}: +49.351.802998{1,3} - gnupg encrypted messages are welcome --------------- key ID: 7CBF764A - gnupg fingerprint: 9288 F17D BBF9 9625 5ABC 285C 26A9 687E 7CBF 764A - (gnupg fingerprint: 3061 CFBF 2D88 F034 E8D2 7E92 EE4E AC98 48D0 359B)-
Attachment:
signature.asc
Description: Digital signature