[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: Gesucht: Webseite mit Unterseiten in PDF packen



Hi Klaus,

> Ich meine htmldoc kann sowas, bin mir aber nicht 100%ig sicher. Aber
> das könnte ein Anfang sein.

Ja, dass ist gut. Vielen Dank. Ein erster (kurzer) Test zeigt, dass bei
mehreren Dokumenten die Verlinkung zwischen den Dokumenten klappt.
Allerdings habe ich auf die Schnelle keine Möglichkeit entdeckt,
rekursive Verzeichnisstrukturen als Eingabe anzugeben.

Wrapper:

1 * wget holt die Seiten
2 * find klappert die Directories ab und sammelt die Dateien ein
3 * htmldoc --webpage -f output.pdf *.html

Zu lösen: Gleichnamige Dateien eindeutig benennen, alle Referenzen
ändern, da htmldoc anscheinend nur auf einem Datenverzeichnis arbeiten
kann. Vermutlich lassen sich Schritt 1/2 elegant mit Python/Perl lösen.

Freundliche Grüße,
Christoph


Reply to: