[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: UTF-8 [was: Re: переход на свободный софт]



On Mon, 19 May 2003 17:30:11 +0200, Yevgen Reznichenko wrote:

>> Frage:  Kann man UTF-8 alles darstellen ???
>
> Ja, Mit UTF-8 (ISO 10646) kann man alle Zeichen kodieren. Soweit ich
> weiss mit UTF-8 kann man bis zu 2^32 = 4.29497e+09 Zeichen kodieren. Es
> gibt allerdings noch kein Font dazu der die alle repräsentieren kann.

Der Zweck von Unicode ist vor allem der, jedem Zeichen einen eindeutigen
Platz in einer grossen Zeichentabelle zu geben, damit es nicht mehr zu
Doppelbelegungen kommt, wie es jetzt bei den zahlreichen
1-Byte-Codetabellen der Fall ist, die alle die gleichen 127 Plätze mit
verschiedenen Zeichen belegen.

Einen *vollständigen* Unicode-Font wird es wohl so schnell auch nicht
geben. Solch ein Font wäre bereits 16 GB gross, bevor man überhaupt
anfangen kann, irgendwelche sinnvollen Informationen (Aussehen eines
Zeichens) in ihm unterzubringen. Und nochmal doppelt so gross, um jedem
Zeichen eine einmalige Form (32 Pixel in allen Kombinationen) zu geben. :-)

Zudem müsste man auch erstmal 4,3 Milliarden verschiedene schriftlich
abbildbare Zeichen zusammenbekommen, was nicht so trivial ist, wie es auf
den ersten Blick vielleicht scheint.

Tom



Reply to: