Re: copiare sito intero

To: debian-italian@lists.debian.org
Subject: Re: copiare sito intero
From: Manuel Paccagnella - <mgiles@email.it>
Date: Sun, 31 Oct 2004 17:17:22 +0100
Message-id: <[🔎] 20041031161722.GA6973@ghostname.dyndns.org>
Mail-followup-to: mgiles@email.it, debian-italian@lists.debian.org
Reply-to: mgiles@email.it
In-reply-to: <[🔎] clqdvp$pt2$1@domitilla.aioe.org>
References: <[🔎] clqdvp$pt2$1@domitilla.aioe.org>

On giovedì 28 ottobre 2004, alle 13:26, andrea wrote:
> ciao a tutti,
> vorrei copiare tutte le pagine html di un sito (zwiki.org) che spesso 
> finisce off-line
> ho provato il comando wget -r http://zwiki.org, ma mi trasferisce solo 
> la prima pagina, insieme con un file robots.txt che elenca le pagine che 
> sono state "disallowed" dall'operazione di trasferimento..
> come posso aggirare la cosa?
> thanzzz
> 

Io per fare i mirror uso:

# wget -r -l inf -nr -E -kK -nd <URL>

così ricrea la struttura del sito, convertendo i link per la
navigazione locale e aggiungendo l'estensione .html a tutti i
file navigabili (anche a quegli irritanti *.php).

Se il problema è il file robots.txt, che non ti lascia fare il mirror,
ho un amico che ha modificato wget per bypassare questo file.
Ciao.

Manuel

===================================================================
OTTAVA LEGGE DEL PROGRAMMATORE:
"E' più facile modificare le esigenze in funzione del programma
 che viceversa."
		-- Leggi di Murphy ---

Reply to:

Follow-Ups:
- Re: copiare sito intero
  - From: luca suriano <luka@akabzone.it>

References:
- copiare sito intero
  - From: andrea <andrea.deaglio@csp.it>

Prev by Date: Mutt e GPG
Next by Date: Pulizia vecchi kernel
Previous by thread: Re: copiare sito intero
Next by thread: Re: copiare sito intero
Index(es):
- Date
- Thread