[Debian] [OT] Erfahrungen mit Web-Crawlern

To: "J.F. Lehmanns deutsche Debian Liste" <debian-user-de@lehmanns.de>
Subject: [Debian] [OT] Erfahrungen mit Web-Crawlern
From: Andreas Tille <tillea@rki.de>
Date: Wed, 28 Mar 2001 12:19:30 +0200 (CEST)
Message-id: <[🔎] Pine.LNX.4.21.0103281147310.612-200000@wr-linux02>

Hallo,

auf meiner Suche durch die Debian-Archive nach einem Web-Crawler bin ich
leider nicht fündig geworden.  Eine Suche auf Sourceforge hat folgendes
ergeben:

http://sourceforge.net/projects/webharvest/  (stable)
http://sourceforge.net/projects/grub/        (alpha)
http://sourceforge.net/projects/jcrawler/    (alpha)
http://sourceforge.net/projects/spindexer/   (alpha)

Hat jemand schon eines dieser Programme im Einsatz und vielleicht ein
Debian-Paket dazu? (Etwas ausführlichere Info im angehefteten HTML-Text.)
Ich bin ansich mit htdig ganz zufrieden, aber bei uns soll unbedingt ein
Crawler eingesetzt werden und htdig ist leider ein indexer.

Viele Grüße

       Andreas.

--
We have joy, we have fun,
we have Linux on our Sun.

Group Name	Description	Status
Harvest Web Indexing	Harvest is a web indexing package, originally disigned for distributed indexing, it can form a powerful system for indexing both large and small web sites. Also now includes Harvest-NG a highly efficient, modular, perl-based web crawler.	stable
grub.org - Distributed Internet Crawler	Grub is a distributed internet crawler/indexer designed to run on multi-platform systems, interfacing with a central server/database.	alpha
Java Web Crawler	A web crawler written in Java.	alpha
spindexer	Spindexer is a Search Engine/Crawler tool similar to UDMsearch or ht://dig - but unlike these tools, Spindexer is very fast and flexible. A simple Perl script works as a front-end to Pavuk and Swish++, allowing a fast crawl across any site(s).	alpha

Reply to:

Prev by Date: Re: [Debian] Bug in gnus/Xemacs?
Next by Date: Re: [Debian] Problem mit T-DSL (PAP-Authentication)
Previous by thread: Re: [Debian] Problem mit T-DSL (PAP-Authentication)
Next by thread: [Debian] Vertical Refresh unter XFree 4* einstellen
Index(es):
- Date
- Thread