[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Probleme mit WebHTTrack



Hallo Leute,

ich möchte gern Webseiten lokal speichern, vornehmlich geht es um
Inhalte von tagesschau.de. Das Problem ist, nach einiger Zeit werden
Inhalte und insbesondere Kommentare entfernt, weshalb mir das spätere
Aufrufen über z.B. Liferea nichts nutzt.
Etwas Recherche brachte mich zu HTTrack und der Web-Oberfläche
WebHTTrack, da es für Linux keine native Oberfläche gibt (was mich nicht
stört). Damit habe ich aber einige Probleme.

Als Hinweis: Debian Squeeze, Gnome

Die Installation von httrack, webhttrack (und Abhängigkeiten) erzeugte
zu meiner Überraschung im Menu Anwendungen/Internet zwei jeweils
identische Einträge von "Browse Mirrored Websites" und "WebHTTrack
Website Copier". Letzterer sollte im Standard-Browser die Oberfläche öffnen.

Erste Frage: Unter System/Einstellungen/Bevorzugte Anwendungen ist
Iceweasel als Browser eingestellt. Einige Anwendungen, z.B. der BOINC
Manager oder eben WebHTTrack, öffnen aber Epiphany, der ebenfalls
installiert ist. Wieso wird die Gnome-Einstellung ignoriert?

Ich habe mich an die Alternativen erinnert und nachgeschaut: Es gibt
gnome-www-browser und x-www-browser. gnome-www-browser scheint mit der
Einstellung unter Gnome aber nichts gemein zu haben.
Nachdem ich beide auf Iceweasel gesetzt habe, wird der auch benutzt. Ein
Blick in das webhttrack-Skript (von dem ich sonst nur Bahnhof verstehe)
zeigte mir eine Stelle mit x-www-browser. Worin liegt der Unterschied?

Zweite Frage: Beim Start versucht der Browser eine Seite
http://enterprise:8080 zu öffnen, was nach einiger Zeit abgebrochen
wird. Laut Statuszeile versucht er, auf http://www.enterprise.com
zuzugreifen. Enterprise ist der Name des Rechners, also localhost. Wieso
klappt das nicht?
Jeder weitere Startversuch lädt einen neuen htsserver und zählt den Port
hoch, also 8081 etc. Wenn ich die Prozesse beende, geht es wieder mit
8080 los, klar. Eine Suche nach dem Effekt im Netz war bisher erfolglos.

Laut Dokumentation soll es eine /etc/httrack.conf geben, bei mir aber
nicht. Eine Logdatei wird unter /var/log nicht angelegt. Ein Start aus
einem X-Terminal zeigt keine merkwürdigen Fehlermeldungen.
Ich denke mal, irgendwie wird die falsche URL an den Browser übergeben.
Leider sind meine Skript-Kenntnisse äußerst marginal :-(

Eine weitere unschöne Sache ergibt die Deinstallation. Nach Purge (ich
nutze Synaptic) bleiben die Menü-Einträge erhalten! Auch nach
Logout/Login ändert sich das nicht. Das sollte eigentlich nicht sein...

Erneute Installation: Versuchtes Laden von http://enterprise:8080 und
Abbruch wegen zu langer Antwortzeit von http://www.enterprise.com:8080/
Gebe ich manuell die vollständige lokale Domain ein, funktioniert es,
also bei http://enterprise.jklocal.de:8080/ , was mit server/index.html
ergänzt wird. Das dürfte natürlich nur klappen, wenn ich das Skript
bereits gestartet habe.

Woran könnte das liegen? Die doppelten Menü-Einträge sind unschön,
jedoch manuell zu entfernen, das aber nach der Installation die
eigentliche Oberfläche nicht aufgerufen wird, ist ausgesprochen schlecht :-(

-- 


Mit freundlichem Gruß
Jan Kappler


Attachment: signature.asc
Description: OpenPGP digital signature


Reply to: