[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: [ssfr] Script de migration latin1 vers utf8



Goldy a écrit :
> giggzounet a écrit :
>> Bonjour à tous,
>>
>> je cherche à faire un script de migration des données latin1 vers utf8.
>> Je suis au boulot et on utilise opensuse. Je suis donc avec la dernière
>> en date 11.2 qui est évidemment tout utf8. J'ai de vieilles données en
>> latin1 et je migre, je migre dans la douleur...
>>
>> Il n'y apas de paquet miraculeux migrationtools-utf8 comme sous debian.
>> J'ai migré tous les noms de fichiers à l'aide de la commande convmv et
>> je m'attelle aux donnée en elle même.
>>
>> Alors dans l'ordre :
>> - avez vous un script merveilleux qui me permette d'avancer mon travail
>> sans avoir à réfléchir ? si oui...ben ce serait fort aimable de me le
>> montrer :D
>> - si non... que pensez vous de celui là :
>> #!/bin/bash
>> FROM=latin1
>> TO=utf-8
>> ICONV="iconv -f $FROM -t $TO"
>> # Convert
>> find ./ -type f -name "*" | while read fn; do
>> echo "migration of ${fn} ($FROM -> $TO)"
>> $ICONV ${fn} >> ${fn}.migration
>> mv ${fn}.migration ${fn}
>> done
>>
>>
>> En fait il marche pas mal. sauf que par exemple les pdf sont par la
>> suite inutilisables. Si vous savez pourquoi...ben je suis tout ouï! :D
>>
>> Merci d'avance
>> Guillaume
> 
> 
> Juste une remarque ou question, mais quel est l'intérêt de convertir les
> fichiers PDF en UTF-8 ?
> 
> À part tout ce qui est à base de fichier texte brut (fichier texte,
> html, xml, etc), il n'y a aucun intérêt à convertir des fichiers PDF qui
> sont des fichiers de données (je pense pas utiliser le bon terme mais on
> m'aura compris), l'affichage des caractères d'un fichier PDF n'est pas
> dépendant d'un codage de caractère, donc il faut ignorer ces fichiers.
> 

Salut,

Oui je m'en suis rendu compte par la suite :D j'ai trouvé sur le net un
script qui fait un test sur les charset via "file" et qui ensuite si le
charset est iso le convertit en utf8. donc ça évite de convertir les
fichiers binaires.

Merci de ta réponse
GiGGz


Reply to: