[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: De pdf a pdf en passant par autre chose



Le 23/08/2016 à 16:30, randy11@free.fr a écrit :
Bonjour François,

Pdftk est la solution. Je l'ai utilisé pour supprimé des marquages dans
des PDFs commerciaux.

Le PDF est du PostScript compressé. Pdftk permet de décompresser le PDF
et donc ensuite de travailler sur le texte PostScript, avec un "sed" par
exemple.

Cette solution n'est évidemment envisageable que pour un PDF de type
"texte" seulement.

Éditer avec un éditeur comme LibreOffice ne me paraît pas judicieux, il est
préférable de travailler avec un éditeur ou un outil purement ASCII.

À cet instant, je ne peux fournir d'exemple et chercher la commande idoine. Si
nécessaire, je peux regarder cela, mais il faut que je le fasse le soir.

Randy11.

Merci.
Je suppose que c'est la commande :

pdftk doc.pdf output doc.unc.pdf uncompress (Uncompress PDF page streams for editing the PDF in a text editor (e.g., vim, emacs))

Alors j'ai fait ça et ça me donne, pour les pdf créés avec latex, un fichier où l'on reconnaît en effet des mots, où l'on peut faire "grep" par ex. Malheureusement, les pdf qu'on m'a demandé de modifier ont été sans doute exportés de libre-office, et grep (donc sed aussi) n'y voit qu'un fichier binaire. En les ouvrant avec emacs je ne trouve pas le texte.

François



Reply to: