Le Tue, 23 Jul 2013 17:22:58 +0200,
jerome moliere <jerome.moliere@gmail.com> a écrit :
Bonjour,
> Bonjour a tous,
> j'ai un souci avec un fichier (export enorme en XMl de data venant
> d'un systeme proprio sous Windows) je dois parser ce fichier et j'ai
> des plantages ...
> J'ai tente un :
> file -bi <monfic>
> il me dit ISO-8859-1
>
> les editeurs de texte genre UltraEdit le voient en ISO-8859-15
>
> j'ai tente un recode -f UTF-8 <fic>
> et apres 15mn de moulinage mon parser se plante au meme endroit...
>
> D'ou ma question, il y a t'il des outils plus avances que file /
> recode pour manipuler les charsets ?des algos de detection plus
> aboutis... bref je ne sais pas quelle tactique adoptee car changer le
> file.encoding de ma JVM ne marche pas en fonctionnant a tatons
>
> cordialement
> J.MOLIERE - Mentor/J
ne serait pas possible d'employer Iconv et de réencoder
le fichier originel balte 1252 vers utf8 ?
slt
bernard
Archive: [🔎] 20130723180431.75f8122d.bernard.schoenacker@free.fr" target="_blank">http://lists.debian.org/[🔎] 20130723180431.75f8122d.bernard.schoenacker@free.fr
--
Lisez la FAQ de la liste avant de poser une question :
http://wiki.debian.org/fr/FrenchLists
Pour vous DESABONNER, envoyez un message avec comme objet "unsubscribe"
vers debian-user-french-REQUEST@lists.debian.org
En cas de soucis, contactez EN ANGLAIS listmaster@lists.debian.org