[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: UTF-8 [was: Re: ?????????????? ???? ?????????????????? ????????]



* Kai Weber wrote:
>> Einen *vollständigen* Unicode-Font wird es wohl so schnell auch nicht
>> geben. Solch ein Font wäre bereits 16 GB gross, bevor man überhaupt
>> anfangen kann,
>> [...]
>> Zudem müsste man auch erstmal 4,3 Milliarden verschiedene schriftlich
>> abbildbare Zeichen zusammenbekommen, was nicht so trivial ist, wie es auf
>> den ersten Blick vielleicht scheint.
>
>Nur um das klarzustellen:
>
>Ein Unicode 3.2 Font müsste "nur" ca 95000 Zeichen enthalten, wäre also
>mitnichten 16GB gross. Ausserdem bezweifle ich stark, dass tatsächlich
>alle 4,3 Milliarden Stellen je mit einem Zeichen gefüllt werden.

Unicode geht nur von U+0000 bis U+10FFFF, das sind 1,1 Millionen
mögliche Zeichen, nicht 4,3 Milliarden. Von diesen 1,1 Millionen Code
Points sind darüber hinaus viele nicht belegt und davon wiederum viele
für private Nutzung oder ähnliche Zwecke belegt, werden also auch nie
genutzt werden.

Arial Unicode MS 1.0 enthält 50377 Glyphen, das dürften so ziemlich alle
Zeichen aus Unicode 2.1 sein. Die Schrift ist im übrigen 23 MB gross.
Damit käme man für eine Schrift mit allen potentiell möglichen Zeichen
auf unter 500 MB. Bei den knapp über 96.000 Zeichen in Unicode 4.0 wären
es sogar unter 50 MB und es gibt Schriften die mehr Zeichen als Arial
Unicode MS 1.0 enthalten, ob die vollständig sind, weiss ich nicht; in
jedem Fall sind sie nicht so weit davon entfernt.



Reply to: