[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: http, wildcards & wget



NN_il_Confusionario ha scritto:
On Fri, Dec 09, 2005 at 02:25:51PM +0100, Davide Prina wrote:

wget -A.m -nd http://www.eas.asu.edu/trace/eee459
così scarichi tutti i file .m


se e solo se la pagina corrispondente all'url
http://www.eas.asu.edu/trace/eee459 contiene una lista di tutti i files
.m (o almeno a tutti i .m ci si arriva ricorsivamente)

in effetti non avevo provato, ma pensavo, da quanto era stato riportato nella mail iniziale, che i file .m fossero nella directory indicata ... invece non sembra essere così

se non sbaglio si può risolvere così:

wget -r -l3 -A.m -nd http://www.eas.asu.edu/trace/eee459

Nota: ho messo l3 per dire di scendere fino a 3 livelli, ma può essere che bisogni andare più a fondo per trovare tutti i file che ti interessano

Il che non per tutti i siti vale, molti disabilitano il directory index
o forniscono un index.html (per esempio il sito in questione).

veramente, per quel poco che ho usato wget, non ho mai riscontrato questo problema. Ho riscontrato altri tipi di blocco, per esempio che veniva impedito l'accesso ai file a quello che non è un browser, ma anche questo è aggirabile identificandosi, ad esempio, come FireFox

Ciao
Davide

--
Dizionari: http://sourceforge.net/projects/linguistico
Conoscere il TC: http://www.no1984.org
Strumenti per l'ufficio: http://it.openoffice.org
Sistema operativo: http://www.it.debian.org
Browser: http://www.mozilla.org/products/firefox
Client di posta: http://www.mozilla.org/products/thunderbird
Linux User: 302090: http://counter.li.org
--
Non autorizzo la memorizzazione del mio indirizzo di posta a chi usa
outlook: non voglio essere invaso da spam



Reply to: