[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: UN PEQUEÑO SCRIPT CON WGET



Camaleon:

El 1 de noviembre de 2010 18:58, Carlos Zuniga <carlos.zun@gmail.com> escribió:
2010/11/1 Camaleón <noelamac@gmail.com>:
> El Mon, 01 Nov 2010 10:26:27 -0600, rantis cares escribió:
>
>> Lista:
>>
>> Parece ser que encontre una buena respuesta, parece que no es con wget
>>
>> ----INICIA----
>> 3.6 Does Wget understand _javascript_?
>>
>> Wget doesn't feature _javascript_ support and is not capable of performing
>> recursive retrieval of URLs included in _javascript_ code.
>
> (...)
>
> Que no entienda _javascript_ de manera nativa no significa que no puedas
> usar algún baipás cuando te encuentres con código _javascript_.
>
> El problema es que el formulario que has puesto de ejemplo no parece que
> use el método convencional de envío de datos al servidor (POST), ese el
> problema :-/
>
> Saludos,
>
> --
> Camaleón
>

Más que no usar el método convencional, parece que lo están intentando ofuscar.

Puedes seguir todo el camino que realiza el _javascript_ para ver a que
url y con que parámetros post se envía, luego hacer lo mismo desde
bash cogiendo los datos de la pagina, pasarlos por grep o awk y de ahí
utilizar wget de nuevo...

Para ser honesto, no se como seguir todo el camino _javascript_, ¿Podrías orientarme un poco para tomar camino en esa direccion?. Lo de bash no sera dificil, lo de grep y awk no creo que haya problemas.
 
Para un ejemplo, un script que hice hace tiempo para descargar
archivos de rapidshare (ojo, ya no funciona con su nueva interfaz)
http://pastebin.com/C3uCuV70

Si estás lidiando con logins, entonces tendrías que ver el soporte
para cookies de wget.

Ok comenzare a buscar por este camino.

Otra opción que todavía no intento es utilizar webkit desde python que
sí te permite ejecutar _javascript_.
http://blog.motane.lu/2009/06/18/pywebkitgtk-execute-_javascript_-from-python/

Saludos a todos.

Reply to: