Re: bash et UTF-8
Le Tue 3/08/2004, Laurent Giroud disait
>
> Effectivement, c'est mieux qu'utiliser les wchar car ceux-ci sont de
> taille fixe et donc moins souples et surtout imposent un encodage
> unicode alors que conserver des char permet de gérer n'importe quel
> type d'encodage supporté par la locale (via la libc). La quantité
> de travail est équivalente en revanche.
1)
la gestion des locales ce n'est *pas* le boulot d'une libc. C'est
dans la glibc mais elle n'est pas partout (et heureusement...)
2) la locale a une granularité trop grande et mélange tout : jeux de
caracyères, langue des messages, formats numériques, etc...
>
> > Ce que tu décris avec wchar est autre chose, mais les
> > ayatollahs de l'UTF-8 sont contre car ça permet aux
> > codages existants (8-bit ou multibyte) de continuer à
> > être supportés, alors qu'il faudrait les éradiquer.
>
> L'éradication me parait un objectif assez utopiste et implique de
> toute manière qu'on dispose toujours de convertisseurs
> local->unicode en cas de rencontre d'un fichier non encodé dans un
> des divers formats unicode. Donc entre le système des locales et ça
> mon coeur balance... :)
>
> > Les 2 approches requièrent beaucoup plus de travail que
> > tu ne sembles l'imaginer.
>
> C'est très possible, en effet comme tu l'indiques, je ne suis pas
> passé de la documentation à la pratique pour l'instant ;)
>
> Mais néanmoins, la libc et gettext gèrent déjà automatiquement
> l'encodage en fonction de la locale, si la lib de recherche
> d'expressions le gère également, c'est autant de travail en moins
> (j'ose espérer que tout le monde ne réécrit pas ses propres routines
> de gestion de chaînes dans son coin). L'essentiel du travail me
> semble assez simple si la gestion des caractères textuels a été
> écrite de façon relativement neutre.
>
> Je vais coder sous peu des trucs en liaison avec tout ça, donc si je
> me trompe je ne manquerais pas de te donner raison ;)
la Glibc, pas la libc. Une libc ne devrait conteni_r *que* ce qui est
défini par la norme du C : les jeux de caractère n'ont rien à y faire;
D'ailleurs sit tu veux que ton code soit autre chose qu'une linuxerie
fermée, va falloir y faire gaffe...
--
Erwan
Reply to: