[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: bash et UTF-8



Le Tue  3/08/2004, Laurent Giroud disait

> 
> Effectivement, c'est mieux qu'utiliser les wchar car ceux-ci sont de
> taille fixe et donc moins souples et surtout imposent un encodage
> unicode alors que conserver des char permet de gérer n'importe quel
> type d'encodage supporté par la locale (via la libc).  La quantité
> de travail est équivalente en revanche.

1) 
la gestion des locales ce n'est *pas* le boulot d'une libc. C'est
dans la glibc mais elle n'est pas partout (et heureusement...)

2) la locale a une granularité trop grande et mélange tout : jeux de
   caracyères, langue des messages, formats numériques, etc...

> 
> > Ce que tu décris avec wchar est autre chose, mais les
> > ayatollahs de l'UTF-8 sont contre car ça permet aux
> > codages existants (8-bit ou multibyte) de continuer à
> > être supportés, alors qu'il faudrait les éradiquer.
> 
> L'éradication me parait un objectif assez utopiste et implique de
> toute manière qu'on dispose toujours de convertisseurs
> local->unicode en cas de rencontre d'un fichier non encodé dans un
> des divers formats unicode. Donc entre le système des locales et ça
> mon coeur balance... :)
>  
> > Les 2 approches requièrent beaucoup plus de travail que
> > tu ne sembles l'imaginer.
> 
> C'est très possible, en effet comme tu l'indiques, je ne suis pas
> passé de la documentation à la pratique pour l'instant ;)
> 
> Mais néanmoins, la libc et gettext gèrent déjà automatiquement
> l'encodage en fonction de la locale, si la lib de recherche
> d'expressions le gère également, c'est autant de travail en moins
> (j'ose espérer que tout le monde ne réécrit pas ses propres routines
> de gestion de chaînes dans son coin).  L'essentiel du travail me
> semble assez simple si la gestion des caractères textuels a été
> écrite de façon relativement neutre.
> 
> Je vais coder sous peu des trucs en liaison avec tout ça, donc si je
> me trompe je ne manquerais pas de te donner raison ;)

la Glibc, pas la libc. Une libc ne devrait conteni_r *que* ce qui est
défini par la norme du C : les jeux de caractère n'ont rien à y faire;
D'ailleurs sit tu veux que ton code soit autre chose qu'une linuxerie
fermée, va falloir y faire gaffe...


-- 
Erwan



Reply to: