[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: [OT] ISO-8859-15 vs. UTF-8



"Rainer Bendig, Digitally Impressed" <webmaster@digitallyimpressed.com> writes:

> -----BEGIN PGP SIGNED MESSAGE-----
> Hash: SHA1
>
> Hi,
>
> Alexander Fieroch schrieb am 26.05.2004 23:16:
> | kann mir einer sagen, worin der Unterschied zwischen der ISO-8859-15 und
> | der UTF-8 Zeichenkodierung besteht?
> | Welche sollte man eher benutzen?
> |
> Ich klau mir nach ein bisschen googlen meine Antwort mal von [1] Quellen
> sind [2] und [3]....
>
> - -- snip --
> Unicode:
> Ein weltweit gültiger Zeichensatz (http://www.unicode.org). Unicode ist
> nahezu identisch mit ISO/IEC 10646 und beinhaltet etwa 40.000
> verschiedene Zeichen. In Unicode hat jedes Zeichen einen 16-Bit-Code.

Soweit ich sehe, war UTF-8 gefragt.  UTF-8 ist eine Kodierung für
Unicode, die mit variabler Länge (1..4 Bytes) arbeitet, wobei die 1
Byte langen Zeichen mit ASCII identisch sind.  Der Witz an UTF-8 ist,
dass Beginn und Ende eines Zeichens auch dann eindeutig feststellbar
sind, wenn in der Mitte eines Bytestromes aufgesetzt wird.

Ich bin sicher, dass Google eine Menge Details dazu weiß.

Gruß,

 Heike



Reply to: