[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

utf-8 : cauchemard, désolation, désespoir....



Bonjour à tous,

Afin d'afficher des caractères japonais (je bosse au japon), je suis
passé à UTF-8. Première impression : ça marche. Deuxième impression : il
y a une foultitude de programmes qui déconnent, et ça commence à me
faire perdre beaucoup de temps. En fait, ça me rapelle le temps où
installer une debian qui accepte les accents français était une
aventure...

Parmis ce qui ne marche pas : des chose pas grave: par exemple, la
playlist de xmms n'affiche plus un seul caractère. Un coup de LC_ALL=C
xmms&, et ça repart.

Juste pour un prog, ça irait, et encore... Mais il y a pire :

aspell ne marche plus. Il bute sur les accents français, et les
considère comme des coupures de mots.

emacs n'accepte plus la saisie des accents et autres cédilles. J'ai viré
mon .emacs, rien n'y fait => Je suis passé à vi.

man et less n'acceptent plus que je fasse de recherche en tapant sur
slash. (=> LC_ALL=C man toto)

centericq pète les plombs.


Mais le fond du problème n'est pas là ; voici l'objet premier de mon
mail :

Les fichiers texte que je créé sont en utf8, avec un encodage différent
pour les accents. Ça signifie que mon monde est coupé en deux parties
qui s'ignorent : iso, et utf8. Tout ce que je fais en utf8 est
de facto inutilisable, à moins d'aimer avoir des é sur ses pages web.

D'où deux questions :

1) Le support utf8 est-il encore inutilisable et expérimental ?

2) Si non, qu'ai-je fait d'incorrect pour en arriver là ?

Question subsidiaire : n'y a-t-il pas un unligne qui me permettrait de
récupérer le fruit de mon travail.txt en iso? Ou un moyen de n'utiliser
utf8 que quand s'imisce un caractère oriental ?

voici une illustration du problème:

lidlpenguin|charles|$ cat > toto
skljgfklsdg

lidlpenguin|charles|$ file toto
toto: ASCII text

lidlpenguin|charles|$ cat > toto
ljlfqskjémljsf

lidlpenguin|charles|$ file toto
toto: UTF-8 Unicode text

lidlpenguin|charles|$ env | grep FR
LANG=fr_FR.UTF-8@euro
GDM_LANG=fr_FR.UTF-8@euro

En éspérant qu'il y ait «un médecin dans la salle»,

-- 
Charles



Reply to: