[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: [HS] UTF-8 ou ISO-8859-15 ?



On 2005-01-07 19:04:24 +0100, Thomas Nemeth wrote:
> 	Oui et non : comment sont gérées les chaines utf-8 lors de la
> 	compilation ? (je suppose qu'il s'en fout comme de l'an 40 et
> 	qu'il passe tous les octets de la chaine à la fonction de
> 	traitement en wchar.

En C, les chaînes sont apparentées à des tableaux de char, où 1 char
correspond à 1 caractère. Donc UTF-8 n'est pas supporté à la base
autrement que comme une suite d'octets. Le type wchar_t peut servir
à représenter les caractères d'Unicode, mais à ce moment, il n'y a
plus de rapport avec UTF-8.

> 	Maintenant suppose que tu es en phase de transition ISO->UTF. Tu
> 	as des fichiers en latin0 et des fichiers en utf-8. Pour utiliser
> 	l'utf-8 avec toutes tes applis tu as mis les locales
> 	kivonbien®©(tm) (fr_FR@UTF-8 si ma mémoire est bonne). Les applis
> 	(genre vim) réussissent-elles à éditer/modifier correctement des
> 	fichiers Latin0 ?

Latin0? Tu veux dire latin1 (iso-8859-1) ou latin9 (iso-8859-15)?
Ça dépend des applications.

> 	Les transforment-elles en utf-8 à la sauvegarde ?

Idem. Emacs est capable d'avoir un encodage d'entrée (lecture fichier)
et un encodage de sortie (écriture fichier) différents, ainsi que pour
les entrées/sorties lorsqu'il est lancé dans un terminal texte.

Pour le XML, les parseurs connaissent en général tous ces encodages,
et c'est indépendant des locales. Idem en sortie d'un processeur XSLT
par exemple.

-- 
Vincent Lefèvre <vincent@vinc17.org> - Web: <http://www.vinc17.org/>
100% accessible validated (X)HTML - Blog: <http://www.vinc17.org/blog/>
Work: CR INRIA - computer arithmetic / SPACES project at LORIA



Reply to: