[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: Вопрос по wget-у...



Dmitry E. Oboukhov пишет:
AL>> Есть сайт, хочется его выкачать, но стартовая страница index.html
AL>> вытаскиваемая wget-ом имеет такой вид (16-ричный):
AL>> 1f 8b 08 00 00 00 00 00 00 03 a5      и т.д., т.е. упакованная gzip-ом.
AL>> Какие опции добавить чтобы wget всё понял и распаковывал содержимое сайта?
А сайт в заголовке сообщает, что там Content-Encoding: gzip?

Наверное да, так-как мозилка всё показывает нормально, но хочется иметь
содержимое сайта у себя для свободного изучения...

чтобы узнать точно ли да надо запустить wget с опцией -S


Возвращает вот такой ответ:

store:~/RW# wget -S -r -e http_proxy=http://127.0.0.1:5865 http://www.netgrafik.ch/russiantimes.htm
--09:42:24--  http://www.netgrafik.ch/russiantimes.htm
          => `www.netgrafik.ch/russiantimes.htm'
Connecting to 127.0.0.1:5865... connected.
Proxy request sent, awaiting response...
1 HTTP/1.1 200 OK
2 Via: 1.1 PROXY
3 Content-Length: 1579
4 Date: Mon, 26 May 2008 09:28:12 GMT
5 Age: 73852
6 Content-Type: text/html
7 Server: Apache/1.3.37 (Unix) mod_gzip/1.3.26.1a mod_auth_passthrough/1.8 mod_log_bytes/1.2 mod_bwlimited/1.4 FrontPage/5.0.2.2635.SR1.2 mod_ssl/2.8.28 OpenSSL/0.9.7a PHP-CGI/0.1b
8 Last-Modified: Wed, 23 Jan 2008 00:35:35 GMT
9 Etag: "1f34424-1373-47968bd7"
10 Accept-Ranges: bytes
11 Keep-Alive: timeout=5, max=1000
12 Content-Encoding: gzip

100%[====================================>] 1,579 1.51M/s ETA 00:00

09:42:24 (1.51 MB/s) - `www.netgrafik.ch/russiantimes.htm' saved [1579/1579]


FINISHED --09:42:24--
Downloaded: 1,579 bytes in 1 files

Люди советуют curl и httrack но я думаю wget это тоже умеет, привык я к нему.

Спасибо.


Reply to: