[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: [OT] ISO-8859-15 vs. UTF-8



-----BEGIN PGP SIGNED MESSAGE-----
Hash: SHA1

Hi,

Alexander Fieroch schrieb am 26.05.2004 23:16:
| kann mir einer sagen, worin der Unterschied zwischen der ISO-8859-15 und
| der UTF-8 Zeichenkodierung besteht?
| Welche sollte man eher benutzen?
|
Ich klau mir nach ein bisschen googlen meine Antwort mal von [1] Quellen
sind [2] und [3]....

- -- snip --
Unicode:
Ein weltweit gültiger Zeichensatz (http://www.unicode.org). Unicode ist
nahezu identisch mit ISO/IEC 10646 und beinhaltet etwa 40.000
verschiedene Zeichen. In Unicode hat jedes Zeichen einen 16-Bit-Code.
Die ersten 256 Plätze entsprechen ISO Latin-1 (ISO 8859-1). Unicode wird
in Java und XML verwendet. Unicode Version 3 enthält bereits die Zeichen
für so alltägliche Bedürfnisse, wie das Schreiben mit altgermanischen
Runen, oder das Kommunizieren mit den knapp 50.000 Cherokee-Indianer in
Oklahoma. Der Rest ist in Reserve. Jedes Zeichen, welches neu
aufgenommen werden soll muss beantragt und von der Organisation
abgesegnet werden.

ISO 8859-1:
Die ISO-8859-Familie wurde vom European Computer Manufacturer's
Association (ECMA) entwickelt. Es handelt sich um ein Set von
standardisierten Zeichensätzen für alphabetische Schriften. Dazu gehören
die lateinischen Schriften, auf denen die meisten Sprachen Westeuropas
und Amerikas beruhen, oder etwa die kyrillischen Schriften.

Alle Zeichensätze dieser Familie basieren auf der 1-Byte-Abbildung eines
Zeichens. Das heißt, alle Zeichensätze enthalten 256 mögliche Zeichen.
Bei allen Zeichensätzen sind die ersten 128 Zeichen, also die Zeichen
mit den Werten 0 bis 127, identisch mit dem ASCII-Zeichensatz. Das hat
den Vorteil, dass die üblichen lateinischen Groß- und Kleinbuchstaben,
die arabischen Ziffern und die üblichen Sonderzeichen wie Satzzeichen
oder kaufmännische Zeichen in all diesen Zeichensätzen immer zur
Verfügung stehen.

- -- snip --

[1] http://www.supportnet.de/discussion/listmessages.asp?recno= ->
~    <- 100660&adminrecno=9
[2] http://selfhtml.teamone.de/inter/zeichensaetze.htm
[3] http://selfhtml.teamone.de/inter/unicode.htm

- --
So long,

Rainer Bendig aka "mindz"
- ------------------------------------------------------------------
PGP/GPG key  (ID: 0xF0A7738A) available via wwwkeys.de.pgp.net
key-fingerprint 178F E5C5 D423 0C6F 7DC9 B6DD A6B5 58B9 F0A7 738A
- ------------------------------------------------------------------
()  ascii ribbon campaign - against html mail
/\  http://arc.pasp.de/   - against microsoft attachments
-----BEGIN PGP SIGNATURE-----
Version: GnuPG v1.2.5rc1 (GNU/Linux)

iD8DBQFAtQuli1D4EGbeRE8RAiXbAJ9ov75g14zNZKQD5unDcWqnDfSlUgCfaoOr
XfajHkymsZGlbKPYfeQBOFM=
=uWe+
-----END PGP SIGNATURE-----



Reply to: