[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: Encoding encore et toujours..



merci a vous, en fait le probleme n'etait pas de l'encoding mais de la donnee reellement pourrie et comment l'exploiter avec un fichier XML de 4Go, vue la volumetrie du fichier j'avais abaisse mon niveau de traces ....
Navre ..mais du coup j'ai fait mumuse avec iconv, que j'avais precedemment cherche avec aptitude et qui en fait vient preinstalle avec la libc...

merci encore
jerome

J.MOLIERE - Mentor/J



Le 23 juillet 2013 18:04, Bernard Schoenacker <bernard.schoenacker@free.fr> a écrit :
Le Tue, 23 Jul 2013 17:22:58 +0200,
jerome moliere <jerome.moliere@gmail.com> a écrit :

> Bonjour a tous,
> j'ai un souci avec un fichier (export enorme en XMl de data venant
> d'un systeme proprio sous Windows) je dois parser ce fichier et j'ai
> des plantages ...
> J'ai tente un :
> file -bi <monfic>
> il me dit ISO-8859-1
>
> les editeurs de texte genre UltraEdit le voient en ISO-8859-15
>
> j'ai tente un recode -f UTF-8 <fic>
> et apres 15mn de moulinage mon parser se plante au meme endroit...
>
> D'ou ma question, il y a t'il des outils plus avances que file /
> recode pour manipuler les charsets ?des algos de detection plus
> aboutis... bref je ne sais pas quelle tactique adoptee car changer le
> file.encoding de ma JVM ne marche pas en fonctionnant a tatons
>
> cordialement
> J.MOLIERE - Mentor/J

Bonjour,

        ne serait pas possible d'employer Iconv et de réencoder
        le fichier originel balte 1252 vers utf8 ?


        slt
        bernard

--
Lisez la FAQ de la liste avant de poser une question :
http://wiki.debian.org/fr/FrenchLists

Pour vous DESABONNER, envoyez un message avec comme objet "unsubscribe"
vers debian-user-french-REQUEST@lists.debian.org
En cas de soucis, contactez EN ANGLAIS listmaster@lists.debian.org
Archive: [🔎] 20130723180431.75f8122d.bernard.schoenacker@free.fr" target="_blank">http://lists.debian.org/[🔎] 20130723180431.75f8122d.bernard.schoenacker@free.fr



Reply to: