[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: #debian-devel-fr@irc.debian.org et UTF-8



On Fri, Mar 05, 2004 at 03:49:23PM +0100, Encolpe DEGOUTE wrote:
> On Fri, Mar 05, 2004 at 03:04:55PM +0100, Mathieu Roy wrote:
> > 
> > > Sebastien Bacher <seb128@debian.org> wrote:
> > >
> > >>> Quant à tout passer en UTF-8, RedHat l'a fait, et visiblement ça n'a
> > >>> pas fait que des heureux, d'après ce que je peux lire ici ou là.
> > >>
> > >> Comme le fait de rester en iso8859 ne fait pas que des heureux ....
> > 
> > Pour ma gouverne, quels problèmes posent le iso8859-(1/15) dans le
> > cadre de communications entre francophones ? A priori, tout les
> > caractères valides dans ce contexte sont bien dispo dans ce charset,
> > non ?
> 
> Sauf que pour certaines applications gérant déjà l'UTF-8, la
> compatibilité ascendante vers latin* est vite un casse tête et il y a
> régulièrement des bugs sur ce sujet.

Heu, des exemples ?

> L'idée de base est de lacher les latin* pour harmoniser les processus,
> et, à la rigueur, le fait d'être français importe peu. Il faut éviter le
> nombrilisme.

Si la seule chose qu'on se contente de faire, c'est de brancher des
tuyaux où coule de l'UTF-8, on n'a pas beaucoup avancé. Par exemple
le debian-installer est tout en UTF-8, mais c'est bizarre, ça ne suffit
pas pouvoir utiliser toutes les langues. Il a fallu modifier des choses
pour le japonais (qui ne met pas d'espaces entre les mots), pour les
langues asiatiques à base d'idéogrammes (qui ont une largeur de 2
caractères) et maintenant l'hébreu et l'arabe sont récalcitrants
(les compétences en ce domaine seront chaleureusement accueillies).
Si on avait utilisé un codage différent par langue à la debconf, le
résultat aurait été strictement le même, mais on aurait été obligé
d'inclure iconv pour faire les conversions. La contrainte de taille
pour pouvoir démarrer depuis une disquette est la seule raison pour
laquelle tout est stocké et affiché directement en UTF-8.

Les japonais sont beaucoup plus branchés m17n (multilingualization),
c'est carrément d'un autre niveau. Et l'utilisation d'un jeu de
caractères unique n'est absolument pas un pré-requis.

Denis



Reply to: