[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: Rechercher dans pdf



Le 26 Mar 2003 12:28:43 +0100
Bertrand lemaitre <bertrand.lemaitre@univ-angers.fr> a écrit :

> Bonjour,
> 
> 
> Je cherche un outil comme grep qui permettrait une recherche d'une
> expression dans tous les fichiers pdf d'un répertoire.

	Ça, je ne connais pas, en revanche :

> A défaut, peut on transformer des pdf en texte normaux?

$ apt-cache show pstotext
Package: pstotext
Priority: optional
Section: text
Installed-Size: 86
Maintainer: J.H.M. Dassen (Ray) <jdassen@debian.org>
Architecture: i386
Version: 1.8g-5
Depends: gs | gs-aladdin (>= 3.51), libc6 (>= 2.2.4-4)
Filename: pool/main/p/pstotext/pstotext_1.8g-5_i386.deb
Size: 31036
MD5sum: a7aeb90618bd90094cc625644aa0d594
Description: Extract text from PostScript and PDF files.
 pstotext extracts text (in the ISO 8859-1 character set) from a
PostScript or PDF (Portable Document Format) file. Thus, pstotext is
similar to the ps2ascii program that comes with ghostscript. The output
of pstotext is however better than that of ps2ascii, because pstotext
deals better with punctuation and ligatures.

	Ça devrait pouvoir faire l'affaire.

	-olivier
--
np : rien !



Reply to: