[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: #debian-devel-fr@irc.debian.org et UTF-8




Unicode n'est qu'une table de caractères, c'est très bien que ça soit
uniformisé, mais ça n'a aucun rapport avec le jeu de caractères de
l'utilisateur. Quand tu es en latin1, tu utilises une table de
conversion sur un sous-ensemble d'Unicode, donc ça devrait te plaire.

Non ce n'est pas une simple table de caractères, c'est une table extensible. Le nombre d'octets pour l'encodage d'un caractère est variable.

Dans le cas où le codage n'est pas spécifié, il y a donc au moins
2 solutions :
 a) imposer un codage unique
 b) permettre de spécifier le codage, comme pour le mail ou le web.
Tu remarqueras que dans les discussions actuelles, personne ne veut
entendre parler de (b), sans jamais fournir de raison valable.

Les deux choses me semblent orthogonales et utiles. Pour employer du vocabulaire à la mode, je dirais que spécifier l'encodage d'un fichier, c'est donner une méta-information (l'information c'est le fichier).

(a) semble être une solution de facilité. Il y a plein d'exemple où l'UTF-8 semble incontournable mais cela ne me semble pas être une raison suffisante pour imaginer que tous les autres encodages peuvent être mis à la poubelle La preuve que le (b) est bien aussi : si c'était bien fait on serait déjà passé au tout utf-8 et très facilement en plus :-).

Quand le codage peut être spécifié, ce qui est le cas dans l'immense majorité des cas (le
contre-exemple flagrant étant le nommage des fichiers), on n'a pas
besoin d'imposer un codage unique.

Il serait evidemment idiot d'essayer de stocker l'encodage des noms de fichiers. Ne pas connaître cette information ne pose aucun problème pour le système de fichier, ce n'est finallement qu'un problème de présentation. Dans ce cas je pense que la meilleure solution est d'espérer qu'un utilisateur qui veut nommer ses fichiers en japonais et en français aura la bonne idée d'utiliser UTF-8. Mais on ne doit pas l'imposer.

Vu que dans certains cas il faut de l'UTF-8 (ou autre jeu de caractères
universel) de toute façon, pourquoi s'encombrer d'autres jeux ?

D'abord parce que imposer une techno à tout le monde, on y arrive pas dans le monde libre. Ensuite parce que l'UTF-8 n'a pas que des avantages, si on écrit tout et toujours en français on perd quelques octets par 'ci par là ;-). C'est un encondage extensible, on peut en faire un encodage universel (c'est déjà fait) mais on peut aussi inventer unicode2 demain. Même si l'unicode devient LE jeu de caractères, il est bon de savoir en changer.


> > > Recommandation de www.openi18n.org, qui comme son nom l'indique
> > > est un organisme cherchant à promouvoir l'i18n sous toutes ses formes
> > > dans le logiciel libre : utiliser l'ASCII.
> > > > C'est du foutage de gueule.
> > Ben voyons, www.openi18n.org est un repère de dinosaures rétrogrades
> dont le seul but est d'empêcher la promotion du multilinguisme, c'est
> évident.

S'ils donnent ce genre de conseils, oui.

On peut aussi penser que c'est un conseil pragmatique. On n'empêche personne d'internationnaliser convenablement sa machine. Mais si vous échangez des informations avec quelqu'un qui ne connait pas votre encodage (UTF-8 par exemple) alors si vous n'avez utilisé que de l'ASCII, ça marche comme même.

Cyril.

_________________________________________________________________
Trouvez l'âme soeur sur MSN Rencontres http://g.msn.fr/FR1000/9551



Reply to: