[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: UTF-8-Editor für mutt



#include <hallo.h>
* Andreas Kroschel [Wed, Jul 28 2004, 08:55:06AM]:

> > UTF-8 ist nicht 16bit. Es kann 16bit sein, öfters weniger, manchmal
> > mehr.
> 
> Ja. Im konkreten Fall - als locale unter Debian ist UTF-8 eingestellt,
> man erstellt eine Datei mit Umlauten, z.b.
> 
> echo aäöü > umlauts
> 
> liegen die Zeichen aus dem ASCII-Bereich im 8 bit vor, die Umlaute in 16
> bit. So macht es auch jeder UTF-8-fähige Editor und genau so will mutt
> es in einer UTF-8-Umgebung haben.

Natürlich. Ich weigere mich aber gegen die Bezeichnung "16bit". Denn sie
ist formal falsch und nicht allgemein gültig. Ausserdem sind das
Sequenzen mit _weniger_ als 16bit Nutzinformation, und sie werden
_nicht_ als 16bit verarbeitet (sondern als zwei Teile eines
Zeichenkodes, in zwei Bytes. Darum ist auch BOM nicht notwendig). Und,
wie schon erwähnt, du beschränkst dich ausschliesslich auf Umlaute,
während Unicode eben für viel mehr erschaffen wurde (obwohl man heute
mit 16bit Nutzinformation auskommt).

Gruss,
Eduard.
-- 
Wer einen Engel sucht und nur auf die Flügel schaut, könnte eine Gans
nach Hause bringen.
		-- Georg Christoph Lichtenberg



Reply to: