[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: [HS] UTF-8 ou ISO-8859-15 ?



Le 09.01.05, Vincent Lefevre a tapoté :

| On 2005-01-07 19:04:24 +0100, Thomas Nemeth wrote:
| > 	Oui et non : comment sont gérées les chaines utf-8 lors de la
| > 	compilation ? (je suppose qu'il s'en fout comme de l'an 40 et
| > 	qu'il passe tous les octets de la chaine à la fonction de
| > 	traitement en wchar.
|
| En C, les chaînes sont apparentées à des tableaux de char, où 1 char
| correspond à 1 caractère. Donc UTF-8 n'est pas supporté à la base
| autrement que comme une suite d'octets. Le type wchar_t peut servir
| à représenter les caractères d'Unicode, mais à ce moment, il n'y a
| plus de rapport avec UTF-8.

	Justement ! Ma question (pas assez claire) était : est-ce qu'en
	utilisant les fonctions utilisant les wchar, le compilo
	comprennait bien les caractères utf-8 comme étant composés de 2
	caractères et si l'utilisation combinée putwchar() et d'une
	police utf-8 ne posait /a priori/ pas de pb.

	Je ne vois, par ailleurs, pas de printf avec un wchar dans
	/usr/include/wchar.h...

	Autre sujet d'inquiétude : si mon source C est en utf-8, le noyau
	comprendra-t-il mes printk utilisant de l'utf-8 ou devrais-je me
	passer d'accents pour mes modules noyaux ? (je la sens mal,
	celle-là).


| > 	Maintenant suppose que tu es en phase de transition ISO->UTF. Tu
| > 	as des fichiers en latin0 et des fichiers en utf-8. Pour utiliser
| > 	l'utf-8 avec toutes tes applis tu as mis les locales
| > 	kivonbien®©(tm) (fr_FR@UTF-8 si ma mémoire est bonne). Les applis
| > 	(genre vim) réussissent-elles à éditer/modifier correctement des
| > 	fichiers Latin0 ?
|
| Latin0? Tu veux dire latin1 (iso-8859-1) ou latin9 (iso-8859-15)?

	Latin0 est un alias de latin9 depuis belle lurette.


| Ça dépend des applications.

	Ça ne m'avance pas beaucoup :)


| > 	Les transforment-elles en utf-8 à la sauvegarde ?
|
| Idem. Emacs est capable d'avoir un encodage d'entrée (lecture fichier)
| et un encodage de sortie (écriture fichier) différents, ainsi que pour
| les entrées/sorties lorsqu'il est lancé dans un terminal texte.
|
| Pour le XML, les parseurs connaissent en général tous ces encodages,
| et c'est indépendant des locales. Idem en sortie d'un processeur XSLT
| par exemple.
|
|

Thomas
-- 
BOFH excuse #308:
CD-ROM server needs recalibration.



Reply to: