[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: [ssfr] Script de migration latin1 vers utf8



giggzounet a écrit :
> Bonjour à tous,
> 
> je cherche à faire un script de migration des données latin1 vers utf8.
> Je suis au boulot et on utilise opensuse. Je suis donc avec la dernière
> en date 11.2 qui est évidemment tout utf8. J'ai de vieilles données en
> latin1 et je migre, je migre dans la douleur...
> 
> Il n'y apas de paquet miraculeux migrationtools-utf8 comme sous debian.
> J'ai migré tous les noms de fichiers à l'aide de la commande convmv et
> je m'attelle aux donnée en elle même.
> 
> Alors dans l'ordre :
> - avez vous un script merveilleux qui me permette d'avancer mon travail
> sans avoir à réfléchir ? si oui...ben ce serait fort aimable de me le
> montrer :D
> - si non... que pensez vous de celui là :
> #!/bin/bash
> FROM=latin1
> TO=utf-8
> ICONV="iconv -f $FROM -t $TO"
> # Convert
> find ./ -type f -name "*" | while read fn; do
> echo "migration of ${fn} ($FROM -> $TO)"
> $ICONV ${fn} >> ${fn}.migration
> mv ${fn}.migration ${fn}
> done
> 
> 
> En fait il marche pas mal. sauf que par exemple les pdf sont par la
> suite inutilisables. Si vous savez pourquoi...ben je suis tout ouï! :D
> 
> Merci d'avance
> Guillaume


Juste une remarque ou question, mais quel est l'intérêt de convertir les
fichiers PDF en UTF-8 ?

À part tout ce qui est à base de fichier texte brut (fichier texte,
html, xml, etc), il n'y a aucun intérêt à convertir des fichiers PDF qui
sont des fichiers de données (je pense pas utiliser le bon terme mais on
m'aura compris), l'affichage des caractères d'un fichier PDF n'est pas
dépendant d'un codage de caractère, donc il faut ignorer ces fichiers.


Reply to: