[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: Umlaute auch innerhalb Debian unterschiedlich, was: Windows-Umlaute unter Linux?



Dirk Salva <dsalva@nutrimatic.ping.de> (Mo 07 Okt 2013 17:14:41 CEST):
> On Mon, Oct 07, 2013 at 04:22:31PM +0200, Peter Funk wrote:
> > Weil E4, F6 und FC die Codes für ä, ö und ü in
> > iso8859-1 sind, speichert Dein "joe" seine Dateien
> > offenbar in diesem Codeset und nicht in UTF-8 ab.
> 
> Aha, danke. Was mich nur wundert ist, dass es keine Art
> "Fallback-Anzeige" gibt. Bisher dachte ich immer, iso8859-1 ist in
> UTF-8 inkludiert und kann somit auf UTF-8-Geräten angezeigt werden. Na,
> hab ich mich wohl getäuscht.

ASCII definiert alles was die Bytewerte von 0x00 bis 0x7f hat.
ISO8859-1 beinhaltet ASCII und definiert dann noch die Bytewerte 0x80 bis 0xff.

UTF-8 ist eine Möglichkeit, Unicode zu kodieren. 

Unicode benutzt „Codepoints“ von derzeit 0x0000 bis 0x10ffff, oder in
der Unicode-Schreibweise als U+0000 bis U+10FFFF - für die derzeit
standardisierten Zeichen..  Diese Codepoints werden nun in verschiedener
Weise kodiert. Zum Beispiel hat das „A“ den Codepoint 0x41, was
„zufällig“ dem „A“ aus dem ASCII und ISO8859-* Zeichensätzen entspricht.
Da bietet sich eine Kodierung an, in der das „A“ auch nur ein Byte
belegt. Das macht pure ASCII-Texte zufällig kompatibel zur
UTF-8-Kodierung von Unicode.  

Nehmen wir das Ö: ASCII kennt das nicht
                  ISO8850-1 kodiert es als 0xD6 , lt. iso_889-1(7)
                  UTF-8 als 0xC396, der Unicode-Codepoint dafür
                            ist U+00D6.


Kann alles falsch sein, ist nur so dargestellt, wie ich es nach
dem Studium der Wikipedia und verschiedenen Selbstexperimenten
festgestellt habe.

    Best regards from Dresden/Germany
    Viele Grüße aus Dresden
    Heiko Schlittermann
-- 
 SCHLITTERMANN.de ---------------------------- internet & unix support -
 Heiko Schlittermann, Dipl.-Ing. (TU) - {fon,fax}: +49.351.802998{1,3} -
 gnupg encrypted messages are welcome --------------- key ID: 7CBF764A -
 gnupg fingerprint: 9288 F17D BBF9 9625 5ABC  285C 26A9 687E 7CBF 764A -
(gnupg fingerprint: 3061 CFBF 2D88 F034 E8D2  7E92 EE4E AC98 48D0 359B)-

Attachment: signature.asc
Description: Digital signature


Reply to: