Hallo Leute, ich möchte gern Webseiten lokal speichern, vornehmlich geht es um Inhalte von tagesschau.de. Das Problem ist, nach einiger Zeit werden Inhalte und insbesondere Kommentare entfernt, weshalb mir das spätere Aufrufen über z.B. Liferea nichts nutzt. Etwas Recherche brachte mich zu HTTrack und der Web-Oberfläche WebHTTrack, da es für Linux keine native Oberfläche gibt (was mich nicht stört). Damit habe ich aber einige Probleme. Als Hinweis: Debian Squeeze, Gnome Die Installation von httrack, webhttrack (und Abhängigkeiten) erzeugte zu meiner Überraschung im Menu Anwendungen/Internet zwei jeweils identische Einträge von "Browse Mirrored Websites" und "WebHTTrack Website Copier". Letzterer sollte im Standard-Browser die Oberfläche öffnen. Erste Frage: Unter System/Einstellungen/Bevorzugte Anwendungen ist Iceweasel als Browser eingestellt. Einige Anwendungen, z.B. der BOINC Manager oder eben WebHTTrack, öffnen aber Epiphany, der ebenfalls installiert ist. Wieso wird die Gnome-Einstellung ignoriert? Ich habe mich an die Alternativen erinnert und nachgeschaut: Es gibt gnome-www-browser und x-www-browser. gnome-www-browser scheint mit der Einstellung unter Gnome aber nichts gemein zu haben. Nachdem ich beide auf Iceweasel gesetzt habe, wird der auch benutzt. Ein Blick in das webhttrack-Skript (von dem ich sonst nur Bahnhof verstehe) zeigte mir eine Stelle mit x-www-browser. Worin liegt der Unterschied? Zweite Frage: Beim Start versucht der Browser eine Seite http://enterprise:8080 zu öffnen, was nach einiger Zeit abgebrochen wird. Laut Statuszeile versucht er, auf http://www.enterprise.com zuzugreifen. Enterprise ist der Name des Rechners, also localhost. Wieso klappt das nicht? Jeder weitere Startversuch lädt einen neuen htsserver und zählt den Port hoch, also 8081 etc. Wenn ich die Prozesse beende, geht es wieder mit 8080 los, klar. Eine Suche nach dem Effekt im Netz war bisher erfolglos. Laut Dokumentation soll es eine /etc/httrack.conf geben, bei mir aber nicht. Eine Logdatei wird unter /var/log nicht angelegt. Ein Start aus einem X-Terminal zeigt keine merkwürdigen Fehlermeldungen. Ich denke mal, irgendwie wird die falsche URL an den Browser übergeben. Leider sind meine Skript-Kenntnisse äußerst marginal :-( Eine weitere unschöne Sache ergibt die Deinstallation. Nach Purge (ich nutze Synaptic) bleiben die Menü-Einträge erhalten! Auch nach Logout/Login ändert sich das nicht. Das sollte eigentlich nicht sein... Erneute Installation: Versuchtes Laden von http://enterprise:8080 und Abbruch wegen zu langer Antwortzeit von http://www.enterprise.com:8080/ Gebe ich manuell die vollständige lokale Domain ein, funktioniert es, also bei http://enterprise.jklocal.de:8080/ , was mit server/index.html ergänzt wird. Das dürfte natürlich nur klappen, wenn ich das Skript bereits gestartet habe. Woran könnte das liegen? Die doppelten Menü-Einträge sind unschön, jedoch manuell zu entfernen, das aber nach der Installation die eigentliche Oberfläche nicht aufgerufen wird, ist ausgesprochen schlecht :-( -- Mit freundlichem Gruß Jan Kappler
Attachment:
signature.asc
Description: OpenPGP digital signature