Dmitry E. Oboukhov пишет:
AL>> Есть сайт, хочется его выкачать, но стартовая страница index.html AL>> вытаскиваемая wget-ом имеет такой вид (16-ричный): AL>> 1f 8b 08 00 00 00 00 00 00 03 a5 и т.д., т.е. упакованная gzip-ом.AL>> Какие опции добавить чтобы wget всё понял и распаковывал содержимое сайта?А сайт в заголовке сообщает, что там Content-Encoding: gzip?Наверное да, так-как мозилка всё показывает нормально, но хочется иметь содержимое сайта у себя для свободного изучения...чтобы узнать точно ли да надо запустить wget с опцией -S
Возвращает вот такой ответ:store:~/RW# wget -S -r -e http_proxy=http://127.0.0.1:5865 http://www.netgrafik.ch/russiantimes.htm
--09:42:24-- http://www.netgrafik.ch/russiantimes.htm => `www.netgrafik.ch/russiantimes.htm' Connecting to 127.0.0.1:5865... connected. Proxy request sent, awaiting response... 1 HTTP/1.1 200 OK 2 Via: 1.1 PROXY 3 Content-Length: 1579 4 Date: Mon, 26 May 2008 09:28:12 GMT 5 Age: 73852 6 Content-Type: text/html7 Server: Apache/1.3.37 (Unix) mod_gzip/1.3.26.1a mod_auth_passthrough/1.8 mod_log_bytes/1.2 mod_bwlimited/1.4 FrontPage/5.0.2.2635.SR1.2 mod_ssl/2.8.28 OpenSSL/0.9.7a PHP-CGI/0.1b
8 Last-Modified: Wed, 23 Jan 2008 00:35:35 GMT 9 Etag: "1f34424-1373-47968bd7" 10 Accept-Ranges: bytes 11 Keep-Alive: timeout=5, max=1000 12 Content-Encoding: gzip100%[====================================>] 1,579 1.51M/s ETA 00:00
09:42:24 (1.51 MB/s) - `www.netgrafik.ch/russiantimes.htm' saved [1579/1579] FINISHED --09:42:24-- Downloaded: 1,579 bytes in 1 filesЛюди советуют curl и httrack но я думаю wget это тоже умеет, привык я к нему.
Спасибо.