Re: Umlaute auch innerhalb Debian unterschiedlich, was: Windows-Umlaute unter Linux?

To: debian-user-german@lists.debian.org
Subject: Re: Umlaute auch innerhalb Debian unterschiedlich, was: Windows-Umlaute unter Linux?
From: Heiko Schlittermann <hs@schlittermann.de>
Date: Mon, 7 Oct 2013 20:58:14 +0200
Message-id: <[🔎] 20131007185814.GI15749@jumper.schlittermann.de>
Mail-followup-to: debian-user-german@lists.debian.org
In-reply-to: <[🔎] 20131007151441.GB8079@dserver.dnetz>
References: <[🔎] 52526A2A.40407@freenet.de> <[🔎] 20131007091358.GA25340@sge.kicks-ass.org> <[🔎] 20131007133129.GA6006@dserver.dnetz> <[🔎] 20131007142231.GA13603@pfmaster> <[🔎] 20131007151441.GB8079@dserver.dnetz>

Dirk Salva <dsalva@nutrimatic.ping.de> (Mo 07 Okt 2013 17:14:41 CEST):
> On Mon, Oct 07, 2013 at 04:22:31PM +0200, Peter Funk wrote:
> > Weil E4, F6 und FC die Codes für ä, ö und ü in
> > iso8859-1 sind, speichert Dein "joe" seine Dateien
> > offenbar in diesem Codeset und nicht in UTF-8 ab.
> 
> Aha, danke. Was mich nur wundert ist, dass es keine Art
> "Fallback-Anzeige" gibt. Bisher dachte ich immer, iso8859-1 ist in
> UTF-8 inkludiert und kann somit auf UTF-8-Geräten angezeigt werden. Na,
> hab ich mich wohl getäuscht.

ASCII definiert alles was die Bytewerte von 0x00 bis 0x7f hat.
ISO8859-1 beinhaltet ASCII und definiert dann noch die Bytewerte 0x80 bis 0xff.

UTF-8 ist eine Möglichkeit, Unicode zu kodieren. 

Unicode benutzt „Codepoints“ von derzeit 0x0000 bis 0x10ffff, oder in
der Unicode-Schreibweise als U+0000 bis U+10FFFF - für die derzeit
standardisierten Zeichen..  Diese Codepoints werden nun in verschiedener
Weise kodiert. Zum Beispiel hat das „A“ den Codepoint 0x41, was
„zufällig“ dem „A“ aus dem ASCII und ISO8859-* Zeichensätzen entspricht.
Da bietet sich eine Kodierung an, in der das „A“ auch nur ein Byte
belegt. Das macht pure ASCII-Texte zufällig kompatibel zur
UTF-8-Kodierung von Unicode.  

Nehmen wir das Ö: ASCII kennt das nicht
                  ISO8850-1 kodiert es als 0xD6 , lt. iso_889-1(7)
                  UTF-8 als 0xC396, der Unicode-Codepoint dafür
                            ist U+00D6.

Kann alles falsch sein, ist nur so dargestellt, wie ich es nach
dem Studium der Wikipedia und verschiedenen Selbstexperimenten
festgestellt habe.

    Best regards from Dresden/Germany
    Viele Grüße aus Dresden
    Heiko Schlittermann
-- 
 SCHLITTERMANN.de ---------------------------- internet & unix support -
 Heiko Schlittermann, Dipl.-Ing. (TU) - {fon,fax}: +49.351.802998{1,3} -
 gnupg encrypted messages are welcome --------------- key ID: 7CBF764A -
 gnupg fingerprint: 9288 F17D BBF9 9625 5ABC  285C 26A9 687E 7CBF 764A -
(gnupg fingerprint: 3061 CFBF 2D88 F034 E8D2  7E92 EE4E AC98 48D0 359B)-

Attachment: signature.asc
Description: Digital signature

Reply to:

References:
- Windows-Umlaute unter Linux?
  - From: Kurt Lehr <Kurt.Lehr@freenet.de>
- Re: Windows-Umlaute unter Linux?
  - From: Jens Schüßler <jgs@trash.net>
- Umlaute auch innerhalb Debian unterschiedlich, was: Windows-Umlaute unter Linux?
  - From: Dirk Salva <dsalva@nutrimatic.ping.de>
- Re: Umlaute auch innerhalb Debian unterschiedlich, was: Windows-Umlaute unter Linux?
  - From: Peter Funk <pf@artcom-gmbh.de>
- Re: Umlaute auch innerhalb Debian unterschiedlich, was: Windows-Umlaute unter Linux?
  - From: Dirk Salva <dsalva@nutrimatic.ping.de>

Prev by Date: Re: Funktion Lenovo L430 mit Wheezy? Alternative Laptops?
Next by Date: Re: Debian 7.1.0 - Vom Terminal wieder zu Gnome?
Previous by thread: Re: Handbuchseiten mit Informationen zu Codierungen
Next by thread: Tastaturlayout für LXDE unter Debian
Index(es):
- Date
- Thread