Re: [HS] UTF-8 ou ISO-8859-15 ?
Le 09.01.05, Vincent Lefevre a tapoté :
| On 2005-01-07 19:04:24 +0100, Thomas Nemeth wrote:
| > Oui et non : comment sont gérées les chaines utf-8 lors de la
| > compilation ? (je suppose qu'il s'en fout comme de l'an 40 et
| > qu'il passe tous les octets de la chaine à la fonction de
| > traitement en wchar.
|
| En C, les chaînes sont apparentées à des tableaux de char, où 1 char
| correspond à 1 caractère. Donc UTF-8 n'est pas supporté à la base
| autrement que comme une suite d'octets. Le type wchar_t peut servir
| à représenter les caractères d'Unicode, mais à ce moment, il n'y a
| plus de rapport avec UTF-8.
Justement ! Ma question (pas assez claire) était : est-ce qu'en
utilisant les fonctions utilisant les wchar, le compilo
comprennait bien les caractères utf-8 comme étant composés de 2
caractères et si l'utilisation combinée putwchar() et d'une
police utf-8 ne posait /a priori/ pas de pb.
Je ne vois, par ailleurs, pas de printf avec un wchar dans
/usr/include/wchar.h...
Autre sujet d'inquiétude : si mon source C est en utf-8, le noyau
comprendra-t-il mes printk utilisant de l'utf-8 ou devrais-je me
passer d'accents pour mes modules noyaux ? (je la sens mal,
celle-là).
| > Maintenant suppose que tu es en phase de transition ISO->UTF. Tu
| > as des fichiers en latin0 et des fichiers en utf-8. Pour utiliser
| > l'utf-8 avec toutes tes applis tu as mis les locales
| > kivonbien®©(tm) (fr_FR@UTF-8 si ma mémoire est bonne). Les applis
| > (genre vim) réussissent-elles à éditer/modifier correctement des
| > fichiers Latin0 ?
|
| Latin0? Tu veux dire latin1 (iso-8859-1) ou latin9 (iso-8859-15)?
Latin0 est un alias de latin9 depuis belle lurette.
| Ça dépend des applications.
Ça ne m'avance pas beaucoup :)
| > Les transforment-elles en utf-8 à la sauvegarde ?
|
| Idem. Emacs est capable d'avoir un encodage d'entrée (lecture fichier)
| et un encodage de sortie (écriture fichier) différents, ainsi que pour
| les entrées/sorties lorsqu'il est lancé dans un terminal texte.
|
| Pour le XML, les parseurs connaissent en général tous ces encodages,
| et c'est indépendant des locales. Idem en sortie d'un processeur XSLT
| par exemple.
|
|
Thomas
--
BOFH excuse #308:
CD-ROM server needs recalibration.
Reply to: