[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: problème avec locales



 
>>>> "KB" <=> Klaus Becker

    Le(On) Wed, 11 Mar 2009 20:19:52 +0100,
    Klaus Becker écrivait(wrote) :


   KB> Salut,
'soir,

   KB> j'utilise KDE 4.2 sur Lenny.

   KB> Je crée avec OOo un petit fichier avec des accents français,
   KB> et j'en fais ensuite un fichier pdf. Problème : les lettres
   KB> comme é,à,ç etc sont affichées comme 

Mais ... elles sont affichées ainsi *dans le pdf* ?
Tu parles plus bas de 'pdftotext', alors c'est dans le fichier texte
après « conversion » ?
[bon, je pars de ce principe]

[...]
   KB>   fr_FR.ISO-8859-1... done fr_FR.UTF-8... done
   KB>   fr_FR.ISO-8859-15@euro... done fr_FR.UTF-8... done
   KB> Generation complete.

Ça à l'air OK, ça.

   KB> Quelque soit la config de locales choisie, mon problème est
   KB> tjs là, alors que par ex dans "konsole", l'affichage est
   KB> correcte.

Mais avec KDE, il me semble que les pblms sont « récupérés » par
icelui.

   KB> Est-ce que le problème vient de pdftotext ? Que puis-je faire
   KB> ?

Je ne connais pas 'pdftotext' ... mais tu peux récupérer des
fichiers *texte* mal encodés avec 'iconv', par exemple ('recode'
aussi, mais je le connais moins).

Cela dit, je ne suis pas sûr que ce soit ce que tu désires, je n'ai
pas bien compris quel devait être le format final.

Pour récupérer ton fichier, vérifier l'encodage de celui-ci, puis
convertir :
$ file mon_fichier.txt
mon_fichier.txt: UTF-8 Unicode text
Puis :
iconv -f UTF-8 -t ISO8859-1 -o nouveau_fichier.txt mon_fichier.txt

Pour (un exemple, donc) convertir un fichier 'mon_fichier.txt'
encodé en UTF-8 en un nouveau fichier 'nouveau_fichier.txt', encodé
en iso8859-1.

Pour avoir la liste (et la façon d'écrire, donc) des locales :
$ iconv --list

Sinon, je vois dans le 'man' de 'pdftotext' :
[...]
 -enc encoding-name
       Sets the encoding to use for text output.  The encoding-name
       must be defined with  the  unicodeMap  command
       (see  xpdfrc(5)).   The  encoding  name  is case-sensitive.
       This defaults to "Latin1" (which is a built-in encoding).
       [config file: textEncoding]
[...]

Apparemment il encode par défaut en iso8859-1, donc si tu es en
UTF-8 (et si j'ai bien compris ta manip'), ça peut effectivement
expliquer les dégâts.

HTH,

   KB> bonne soirée

Merci, toi aussi ! ;)

                                Jeep.

-- 
Banquier : Homme secourable qui vous prête un parapluie quand il
fait beau, et qui vous le réclame dès qu'il commence à pleuvoir. 
	-+- René Bergeron -+-


Reply to: