[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: Seconde tentative (was: [HS]: Indéxer des PDF, PS...)



On 9 Feb 2004, Xavier Maillard told this:

> On 8 Feb 2004, Xavier Maillard verbalised:
> 
> J'ai toujour rien trouvé donc si quelqu'un a une idée, l'offre tient
> toujours :)

Bon en fait c'est pas tout à fait vrai. Mon idée c'est de faire une
ch'tite transformation PDF->TXT puis lancer l'indéxation sur ça. Mon
seul problème c'est que je ne suis pas sûr de la fiabilité de la
méthode à savoir: que donne une transformation PDF->TXT ?

Enfin c'est la meilleure piste que j'ai et en plus avec un peu de perl
je devrais m'en sortir.

L'inconnue c'est vraiment de savoir si on peut faire confiance à du
texte généré à partir d'un PDF.

Je vais voir ça.

zeDek
-- 
  "GNU is my religion"

.O.  Xavier Maillard 
..O   Reims - France 
OOO  +33 6 68 04 64 37 

Attachment: pgpxaHulxIyyw.pgp
Description: PGP signature


Reply to: