[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: Descargar archivos con wget



El 12/02/14 00:14, Vicios escribió:
> El 11/02/14 22:22, Ismael L. Donis Garcia escribió:
>>
>> ----- Original Message ----- From: "Gerardo Diez García"
>> <gerardo.diez.garcia@gmail.com>
>> To: <debian-user-spanish@lists.debian.org>
>> Sent: Tuesday, February 11, 2014 3:39 PM
>> Subject: Re: Descargar archivos con wget
>>
>>
>>> El 11/02/14 18:58, Ismael L. Donis Garcia escribió:
>>>>> ----- Original Message ----- From: Ricardo Eureka!
>>>>> To: debian-user-spanish@lists.debian.org
>>>>> Cc: lista debian
>>>>> Sent: Tuesday, February 11, 2014 11:50 AM
>>>>> Subject: Re: Descargar archivos con wget
>>>>>
>>>>> El 11 de febrero de 2014, 13:28, Ismael L. Donis Garcia
>>>>> <ismael@citricos.co.cu> escribió:
>>>>>
>>>>> Subject: Re: Descargar archivos con wget
>>>>>
>>>>>
>>>>> Tampoco funciona con esas opciones.
>>>>>
>>>>> Sigo sin encontrar una forma de descargar todos los archivos que se
>>>>> encuentran en un sitio, los cuales no conozco su nombre.
>>>>>
>>>>> Existe algún otro descargador a consola que no sea wget que lo
>>>>> permita?
>>>>>
>>>>> En caso de que este lo permita, alguien conoce como hacerlo con wget?
>>>>>
>>>>>
>>>>> Lo que te han indicado con wget debiera funcionar. Es posible, que
>>>>> estemos dando por ciertos algunas cosas que no lo son:
>>>>>
>>>>>
>>>>> Sabes con certeza que en ese servidor hay un servidor web corriendo?
>>>>> Si ingresas desde un navegador, tienes acceso a >alguna/s pagina/s? El
>>>>> equipo desde donde ingresaste el comando esta correctamente
>>>>> configurado y tiene llegada al mismo?
>>>>>
>>>>> Cual es el resultado del comando wget que te han recomendado?
>>>>>
>>>>
>>>> Si hay un servidor apache corriendo de seguro, porque estoy haciendo
>>>> las
>>>> pruebas sobre mi PC.
>>>>
>>>> Crea la estructura de las carpetas contenido dentro de ellas, y en cada
>>>> carpeta crea un archivo llamado index.html con el contenido de las
>>>> carpetas.
>>>>
>>>> Por ejemplo un archivo index.html deci esto:
>>>>
>>>> <!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 3.2 Final//EN">
>>>> <html>
>>>> <head>
>>>>  <title>Index of /documentacion/linux</title>
>>>> </head>
>>>> <body>
>>>> <h1>Index of /documentacion/linux</h1>
>>>> <table><tr><th><img src="../../icons/blank.gif" alt="[ICO]"></th><th><a
>>>> href="http://192.168.0.60/documentacion/linux/?C=N;O=D";>Name</a></th><th><a
>>>>
>>>>
>>>> href="http://192.168.0.60/documentacion/linux/?C=M;O=A";>Last
>>>> modified</a></th><th><a
>>>> href="http://192.168.0.60/documentacion/linux/?C=S;O=A";>Size</a></th><th><a
>>>>
>>>>
>>>> href="http://192.168.0.60/documentacion/linux/?C=D;O=A";>Description</a></th></tr><tr><th
>>>>
>>>>
>>>> colspan="5"><hr></th></tr>
>>>> <tr><td valign="top"><img src="../../icons/back.gif"
>>>> alt="[DIR]"></td><td><a href="../index.html">Parent
>>>> Directory</a></td><td>&nbsp;</td><td align="right">  -
>>>> </td><td>&nbsp;</td></tr>
>>>> <tr><td valign="top"><img src="../../icons/folder.gif"
>>>> alt="[DIR]"></td><td><a
>>>> href="http://192.168.0.60/documentacion/linux/Clases%20de%20Linux_2011/";>Clases
>>>>
>>>>
>>>> de Linux_2011/</a></td><td align="right">03-Nov-2012 10:27  </td><td
>>>> align="right">  - </td><td>&nbsp;</td></tr>
>>>> <tr><td valign="top"><img src="../../icons/unknown.gif" t="[
>>>> ]"></td><td><a
>>>> href="http://192.168.0.60/documentacion/linux/Comando%20de%20Linux";>Comando
>>>>
>>>>
>>>> de Linux</a></td><td align="right">16-Aug-2009 14:25  </td><td
>>>> align="right">4.0K</td><td>&nbsp;</td></tr>
>>>> <tr><td valign="top"><img src="../../icons/folder.gif"
>>>> alt="[DIR]"></td><td><a
>>>> href="http://192.168.0.60/documentacion/linux/Curso/";>Curso/</a></td><td
>>>>
>>>> align="right">30-Sep-2013 11:01  </td><td align="right">  -
>>>> </td><td>&nbsp;</td></tr>
>>>> <tr><td valign="top"><img src="../../icons/layout.gif" t="[
>>>> ]"></td><td><a
>>>> href="http://192.168.0.60/documentacion/linux/El-Libro-del-Administrador-Debian.pdf";>El-Libro-del-Administrador-Debian.pdf</a></td><td
>>>>
>>>>
>>>> align="right">10-May-2013 01:30  </td><td
>>>> align="right">5.3M</td><td>&nbsp;</td></tr>
>>>> <tr><td valign="top"><img src="../../icons/text.gif"
>>>> alt="[TXT]"></td><td><a
>>>> href="http://192.168.0.60/documentacion/linux/Formato%2012%20horas.txt";>Formato
>>>>
>>>>
>>>> 12 horas.txt</a></td><td align="right">05-Sep-2009 08:50  </td><td
>>>> align="right">1.4K</td><td>&nbsp;</td></tr>
>>>> <tr><td valign="top"><img src="../../icons/text.gif"
>>>> alt="[TXT]"></td><td><a
>>>> href="http://192.168.0.60/documentacion/linux/Formato%20de%20reloj%20de%2012%20horas%20(AM_PM).html">Formato
>>>>
>>>>
>>>> de reloj de 12 horas (AM_PM).html</a></td><td align="right">01-Feb-2011
>>>> 08:52  </td><td align="right"> 99K</td><td>&nbsp;</td></tr>
>>>> <tr><td valign="top"><img src="../../icons/folder.gif"
>>>> alt="[DIR]"></td><td><a
>>>> href="http://192.168.0.60/documentacion/linux/Formato%20de%20reloj%20de%2012%20horas%20(AM_PM)_files/">Formato
>>>>
>>>>
>>>> de reloj de 12 horas (AM_PM)_files/</a></td><td
>>>> align="right">01-Feb-2011 08:39  </td><td align="right">  -
>>>> </td><td>&nbsp;</td></tr>
>>>> <tr><td valign="top"><img src="../../icons/unknown.gif" t="[
>>>> ]"></td><td><a
>>>> href="http://192.168.0.60/documentacion/linux/Guia%20de%20instalacion%20de%20Linux.doc";>Guia
>>>>
>>>>
>>>> de instalacion de Linux.doc</a></td><td align="right">21-Sep-2013 13:11
>>>> </td><td align="right"> 72K</td><td>&nbsp;</td></tr>
>>>> <tr><td valign="top"><img src="../../icons/layout.gif" t="[
>>>> ]"></td><td><a
>>>> href="http://192.168.0.60/documentacion/linux/Linux.pdf";>Linux.pdf</a></td><td
>>>>
>>>>
>>>> align="right">09-Nov-2011 12:45  </td><td
>>>> align="right">1.9M</td><td>&nbsp;</td></tr>
>>>> <tr><td valign="top"><img src="../../icons/layout.gif" t="[
>>>> ]"></td><td><a
>>>> href="http://192.168.0.60/documentacion/linux/Xfce%20-%20Debian%20Wiki.pdf";>Xfce
>>>>
>>>>
>>>> - Debian Wiki.pdf</a></td><td align="right">27-Dec-2012 08:28  </td><td
>>>> align="right"> 34K</td><td>&nbsp;</td></tr>
>>>> <tr><td valign="top"><img src="../../icons/text.gif"
>>>> alt="[TXT]"></td><td><a
>>>> href="http://192.168.0.60/documentacion/linux/descromprimir%20linux.txt";>descromprimir
>>>>
>>>>
>>>> linux.txt</a></td><td align="right">17-May-2011 05:59  </td><td
>>>> align="right">767 </td><td>&nbsp;</td></tr>
>>>> <tr><td valign="top"><img src="../../icons/unknown.gif" t="[
>>>> ]"></td><td><a
>>>> href="http://192.168.0.60/documentacion/linux/esDebian.doc";>esDebian.doc</a></td><td
>>>>
>>>>
>>>> align="right">22-Apr-2010 16:49  </td><td
>>>> align="right">124K</td><td>&nbsp;</td></tr>
>>>> <tr><td valign="top"><img src="../../icons/text.gif"
>>>> alt="[TXT]"></td><td><a
>>>> href="http://192.168.0.60/documentacion/linux/kernel-a-la-debian.html";>kernel-a-la-debian.html</a></td><td
>>>>
>>>>
>>>> align="right">10-Dec-2010 13:07  </td><td align="right">
>>>> 24K</td><td>&nbsp;</td></tr>
>>>> <tr><th colspan="5"><hr></th></tr>
>>>> </table>
>>>> <address>Apache/2.2.22 (Debian) Server at 192.168.0.60 Port
>>>> 80</address>
>>>> </body></html>
>>>>
>>>> Saludos Reiterados
>>>> ========
>>>> | ISMAEL |
>>>> ========
>>>>
>>>>
>>>>
>>> Prueba a hacer una cosa. Sustituye ese http://192.168.0.68 por un . en
>>> alguno de los enlaces y prueba a ver si descarga ese archivo.
>>>
>>>
>>
>>
>> Si lo descarga perfecto por ejemplo:
>>
>> wget -c http://192.168.0.60/documentacion/linux/Linux.pdf
>>
>> y si escribo esa dirección dentro de un archivo por ejemplo
>> descargar.txt y digo
>>
>> wget -i descargar.txt
>>
>> También me lo descarga, pero el problema es que yo no voy a conocer el
>> nombre de los archivos a descargar. Y otro problema es que solo me lo
>> pueden hacer desde consola.
>>
>> Saludos Reiterados
>> ========
>> | ISMAEL |
>> ========
>>
>>
>>
> 
> No he seguido el hilo completo pero me gustaría contestar este último
> parrafo...
> 
>> También me lo descarga, pero el problema es que yo no voy a conocer el
>> nombre de los archivos a descargar. Y otro problema es que solo me lo
>> pueden hacer desde consola.
> 
> El único problema que yo veo es que no conoces el nombre de los archivos
> pero si tienes datos de cómo se construye la URL yo pondría a wget en
> modo crawler en busca de coincidencias. En caso de no saber qué nombre o
> ruta tendrán los archivos siempre puedes tirar de un fuzzer si no te
> importa hacer mucho ruido...
> 
> Para descargarlo wget o curl... Pero como comentas lo primero es
> encontrar la URL del fichero.
> 
> Saludos!
> 
> 
Acabo de hacer la prueba

wget -r http://git-annex.branchable.com

empieza a descargar todos los archivos habidos y por haber dentro de ese
dominio (el manual indica que por defecto baja hasta 5 niveles)
El problema no me parece que esté en wget sino en la página que se está
intentando descargar


Reply to: