El 1 de noviembre de 2010 18:58, Carlos Zuniga
<carlos.zun@gmail.com> escribió:
2010/11/1 Camaleón <noelamac@gmail.com>:
> El Mon, 01 Nov 2010 10:26:27 -0600, rantis cares escribió:
>
>> Lista:
>>
>> Parece ser que encontre una buena respuesta, parece que no es con wget
>>
>> ----INICIA----
>> 3.6 Does Wget understand _javascript_?
>>
>> Wget doesn't feature _javascript_ support and is not capable of performing
>> recursive retrieval of URLs included in _javascript_ code.
>
> (...)
>
> Que no entienda _javascript_ de manera nativa no significa que no puedas
> usar algún baipás cuando te encuentres con código _javascript_.
>
> El problema es que el formulario que has puesto de ejemplo no parece que
> use el método convencional de envío de datos al servidor (POST), ese el
> problema :-/
>
> Saludos,
>
> --
> Camaleón
>
Más que no usar el método convencional, parece que lo están intentando ofuscar.
Puedes seguir todo el camino que realiza el _javascript_ para ver a que
url y con que parámetros post se envía, luego hacer lo mismo desde
bash cogiendo los datos de la pagina, pasarlos por grep o awk y de ahí
utilizar wget de nuevo...
Para ser honesto, no se como seguir todo el camino _javascript_, ¿Podrías orientarme un poco para tomar camino en esa direccion?. Lo de bash no sera dificil, lo de grep y awk no creo que haya problemas.
Para un ejemplo, un script que hice hace tiempo para descargar
archivos de rapidshare (ojo, ya no funciona con su nueva interfaz)
http://pastebin.com/C3uCuV70
Si estás lidiando con logins, entonces tendrías que ver el soporte
para cookies de wget.
Ok comenzare a buscar por este camino.
Otra opción que todavía no intento es utilizar webkit desde python que
sí te permite ejecutar _javascript_.
http://blog.motane.lu/2009/06/18/pywebkitgtk-execute-_javascript_-from-python/