Re: #debian-devel-fr@irc.debian.org et UTF-8

To: debian-devel-french@lists.debian.org
Subject: Re: #debian-devel-fr@irc.debian.org et UTF-8
From: "Cyril Olivier MARTIN" <mcoolive@hotmail.com>
Date: Sun, 07 Mar 2004 16:34:40 +0100
Message-id: <[🔎] BAY9-F11rSClxnp3yd600059398@hotmail.com>

Unicode n'est qu'une table de caractères, c'est très bien que ça soit
uniformisé, mais ça n'a aucun rapport avec le jeu de caractères de
l'utilisateur. Quand tu es en latin1, tu utilises une table de
conversion sur un sous-ensemble d'Unicode, donc ça devrait te plaire.

Non ce n'est pas une simple table de caractères, c'est une table extensible.Le nombre d'octets pour l'encodage d'un caractère est variable.

Dans le cas où le codage n'est pas spécifié, il y a donc au moins
2 solutions :
 a) imposer un codage unique
 b) permettre de spécifier le codage, comme pour le mail ou le web.
Tu remarqueras que dans les discussions actuelles, personne ne veut
entendre parler de (b), sans jamais fournir de raison valable.

Les deux choses me semblent orthogonales et utiles. Pour employer duvocabulaire à la mode, je dirais que spécifier l'encodage d'un fichier,c'est donner une méta-information (l'information c'est le fichier).

(a) semble être une solution de facilité. Il y a plein d'exemple où l'UTF-8semble incontournable mais cela ne me semble pas être une raison suffisantepour imaginer que tous les autres encodages peuvent être mis à la poubelleLa preuve que le (b) est bien aussi : si c'était bien fait on serait déjàpassé au tout utf-8 et très facilement en plus :-).

Quand le codage peut être spécifié, ce qui est le cas dans l'immensemajorité des cas (le
contre-exemple flagrant étant le nommage des fichiers), on n'a pas
besoin d'imposer un codage unique.

Il serait evidemment idiot d'essayer de stocker l'encodage des noms defichiers.Ne pas connaître cette information ne pose aucun problème pour le système defichier, ce n'est finallement qu'un problème de présentation. Dans ce cas jepense que la meilleure solution est d'espérer qu'un utilisateur qui veutnommer ses fichiers en japonais et en français aura la bonne idée d'utiliserUTF-8. Mais on ne doit pas l'imposer.

Vu que dans certains cas il faut de l'UTF-8 (ou autre jeu de caractères
universel) de toute façon, pourquoi s'encombrer d'autres jeux ?

D'abord parce que imposer une techno à tout le monde, on y arrive pas dansle monde libre.Ensuite parce que l'UTF-8 n'a pas que des avantages, si on écrit tout ettoujours en français on perd quelques octets par 'ci par là ;-).C'est un encondage extensible, on peut en faire un encodage universel (c'estdéjà fait) mais on peut aussi inventer unicode2 demain. Même si l'unicodedevient LE jeu de caractères, il est bon de savoir en changer.

> > > Recommandation de www.openi18n.org, qui comme son nom l'indique

> > > est un organisme cherchant à promouvoir l'i18n sous toutes sesformes

> > > dans le logiciel libre : utiliser l'ASCII.
> > > > C'est du foutage de gueule.
> > Ben voyons, www.openi18n.org est un repère de dinosaures rétrogrades
> dont le seul but est d'empêcher la promotion du multilinguisme, c'est
> évident.

S'ils donnent ce genre de conseils, oui.

On peut aussi penser que c'est un conseil pragmatique. On n'empêche personned'internationnaliser convenablement sa machine. Mais si vous échangez desinformations avec quelqu'un qui ne connait pas votre encodage (UTF-8 parexemple) alors si vous n'avez utilisé que de l'ASCII, ça marche comme même.


Cyril.

_________________________________________________________________
Trouvez l'âme soeur sur MSN Rencontres http://g.msn.fr/FR1000/9551

Reply to:

Prev by Date: Re: #debian-devel-fr@irc.debian.org et UTF-8
Next by Date: Re: Thanks!
Previous by thread: Re: #debian-devel-fr@irc.debian.org et UTF-8
Next by thread: Abwesenheitsnotiz: Word file
Index(es):
- Date
- Thread