[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: UTF8 gtk et gnome



On Thursday 4 September 2003, at 10 h 41, the keyboard of Laurence Colombet 
<Laurence.Colombet@Idealx.com> wrote:

>   C'est drôle, lynx s'en sort très bien pour les pages web: il regarde ta
> locale (justement!) pour savoir quel est l'encodage que tu veux, et les
> caractères qui n'en font pas partie, il les traduit pour te les afficher
> de manière "raisonnable".

Mais parce que le protocole HTTP indique le jeu de caractères et l'encodage 
(idem pour MIME et le courrier). Pour les noms ou les contenus des fichiers 
locaux, l'application (ls, more, etc) ne peut pas deviner. La locale ne sert à 
rien dans ce cas puisque les fichiers peuvent avoir été créés par des 
utilisateurs différents. La seule solution raisonnable est de normaliser (tout 
en UTF-8 et je ne veux voir qu'une tête et tant pis si Erwan n'est pas 
content).

>   Au fait, est-ce que GTK-2 supporte l'UTF-16 (qui contrairement à
> l'UTF-8, n'est pas un espèce d'ignoble cludge où la taille d'un caractère
> dépend du contexte)? 

La taille d'un caractère change en fonction du contexte en UTF-16 aussi (si 
vous dites que non, regardez à "Surrogates" dans un glossaire Unicode : ça, 
c'est un kludge, une survivance du passé d'Unicode). Vous devriez utiliser 
UTF-32, le seul où le nombre de bits est constant.

> Ça, ça pose problème à cause des caractères "null" qui se baladent, 

C'est un euphémisme, de dire "ça pose un problème". UTF-16 et UTF-32 cassent tout simplement toutes les applications existantes et toutes les fonctions de la libc. Ce n'est pas étonnant qu'UTF-8 soit l'encodage spécifié dans tous les protocoles Internet qui utilisent Unicode (sauf IDN), malgré les trolles qui le qualifient d'ignoble kludge.




Reply to: