[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: UTF-8



Le Tue, 27 Jan 2004 18:22:50 +0100, Denis Barbier écrivait :
>Ce n'est pas normal, quelle version de Debian utilises-tu ?
stable, mais je crois me souvenir avoir voulu convertir les pages
de latin1 en utf-8, avec je-ne-sais-plus-quel outil...

hum j'ai retrouvé mon script :
===
#!/bin/sh
#
# Convertit des fichiers depuis la locale iso-8859-15 vers utf-8
for i  in  `ls *gz` ; do
echo convertit $i
echo `basename $i`
zcat $i | iconv --from-code=ISO-8859-15 --to-code=UTF-8 > $i.conv
mv $i.conv `basename $i .gz`
gzip -f `basename $i .gz`
done
===

Bon j'avais dit que c'était du latin9, et c'était peut-être faux, mais il
n'y a pas beaucoup de caractères euro dans les man pages.
En regardant de plus près le résultat de la conversion, je m'aperçois
que le «à» est codé quelque chose comme c383 c2a0 au lieu de c3a0.
C'est comme si la conversion avait été faite 2 fois.
J'ai dû merder quelque part, car en patchant à la main un caractère
accentué (sans mise en forme, j'imagine que le problème de groff
doit être une éventuelle mauvaise interprétation en multi octets ?),
ça fonctionne.

Il y a un package pour rétablir les man pages et recommencer
la conversion ?

--
PII233




Reply to: