Le 8 août 2025 11:20:48 GMT+02:00, "Benoît Barbier" <benoitlst@ouvaton.org> a écrit :
Bonjour à toutes et tous,
Ce petit mot pour partager remercier les personnes qui m’ont répondue.
J’ai finalement opté pour LaTeX et pdfpages
En deux mots :
\documentclass[openany,12pt,a4paper]{book
\usepackage{pdfpages}
\usepackage{fancyhdr}
\usepackage{lastpage}
\begin{document}
\includepdf[pages=-,fitpaper=true,addtotoc={1,section,1,{Titre dans la TOC},RepereDeTexte}]{chemain/relatif/vers/le/fichier.pdf}
\end{document}
pages=-
- (tiret)Ça veut dire toutes les pages, si non on les énumère
fitpaper=true
Ça veut dire qu’on veut que si le pdf est en a4 il reste en a4 (donc écrase les marges du document pdf
addtotoc={1,section,1,{Titre dans la TOC},RepereDeTexte}
Sert à ajouter la page dans la TOC (Table des matières), avec :
1 : numéro de page du PDF inséré,
le niveau dans le document ex : chapter ou section
1 pour indiquer le niveau dans la TOC,
Titre affiché dans la TOC
Label pour les liens internes
Le petit défaut, c’est qu’une ligne à écrire, dans ce format, pour chaque fichier PDF à inclure, c’est « prise-de-tête », l’énorme avantage, c’est de pouvoir itérer avec un script pour parcourir l’arborescence des répertoires, y chercher les fichiers.pdf, composer cette ligne et la rediriger vers le fichier LaTeX.
La numérotation des pages en surimpression dans la marge du pdf, se fait avec le package fancyhdr.
\cfoot{Page \thepage \ de \pageref{LastPage}}
c = centré, mais il y a gauche ou droite, foot pied de page, mais on peut le mettre autre part.
\thepage, c’est le numéro de la page courante.
Le nombre total de pages du document : \pageref{LastPage}
Il va de soi que je n’ai pas sucé tout ça de mon pouce, je me suis fait aider sur une liste dédiée à LaTeX.
Voilà pour mes deux centimes au cas où d’autres quelque part sur le net se poseraient la question.
--
Benoît
Le 6/07/25 à 08:40, Michel Verdier a écrit :
Le 5 juillet 2025 Benoît Barbier a écrit :
Je recherche une liste de logiciels libres, si possible en paquet dans le
dépôt Debian, pour assembler des PDF (document papier qui ont été numérisés en
fichiers PDF), en un document, ajouter un foliotage(pagination), avec la
possibilité d’intercaler des pages de chapitre et de créer une table des
matières par chapitres ajoutés.
Et si possible, ajouter des repères de texte dans les fichiers PDF séparés
pour créer une table des matières avec des sections.
Pour ce qui est de concaténer des pdf on t'a donné des pistes. Mais je
suppose que ça ne couvre pas le reste. Peut-être devrais-tu utiliser un
logiciel de rédaction. Perso j'utiliserais LaTeX qui concatènera
pdf/images et te donnera la main sur pagination, chapitrage, sections,
table des matières et bien plus. Et une présentation pro.
Je me demande s'il ne serait pas plus simple de passer par une reconnaissance
optique de caractères, mais dans certain cas, ça va être difficile, car c'est
des articles de presse, papier en colonnes numérisées avec des images.
Oui ça doit au moins pouvoir alimenter un index de mots (LaTeX gère ça
aussi). Mais c'est sûr qu'il y aura du tri à faire.