[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Encoding encore et toujours..



Bonjour a tous,
j'ai un souci avec un fichier (export enorme en XMl de data venant d'un systeme proprio sous Windows) je dois parser ce fichier et j'ai des plantages ...
J'ai tente un :
file -bi <monfic>
il me dit ISO-8859-1

les editeurs de texte genre UltraEdit le voient en ISO-8859-15

j'ai tente un recode -f UTF-8 <fic>
et apres 15mn de moulinage mon parser se plante au meme endroit...

D'ou ma question, il y a t'il des outils plus avances que file / recode pour manipuler les charsets ?des algos de detection plus aboutis...
bref je ne sais pas quelle tactique adoptee car changer le file.encoding de ma JVM ne marche pas en fonctionnant a tatons

cordialement
J.MOLIERE - Mentor/J


Reply to: