[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: wget y javascript



2012/1/7 rantis cares <rantiscares@gmail.com>:
> El día 6 de enero de 2012 01:55, ignacio holzinger
> <holzingerignacio@gmail.com> escribió:
>>
>> El 06/01/2012 07:50, "rantis cares" <rantiscares@gmail.com> escribió:
>>
>>
>>>
>>> Listeros:
>>>
>>> Espero que esten comenzando bien este año 2012.
>>>
>>> ¿Existe alguna manera de descargar archivos pdf de una web, que son
>>> filtrados mediante javascript?.
>>>
>>> Antecedentes:
>>>
>>> Anteriormente entraba yo a una web en donde estaban alojados unos pdfs
>>> (miles). Logre bajarlos con wget, sin embargo (yo creo que se dieron
>>> cuenta de lo que hice) y cambiaron su manera de mostrar dichos
>>> archivos. Ahora no estan a la vista y para acceder a ellos solo lo
>>> puedo hacer mediante el explorador y dando clicks para descargarlos.
>>>
>>> Wget ya no funciona para esto, he revisado algunos post y confirman lo
>>> que yo temia.
>>>
>>> ¿Alguna idea para hacer descargarmelas de modo automatico?.
>>>
>>> Gracias
>>>
>>>
>> Pega aquí la dirección de la página.
>
> http://www.finalemusic.com/showcase/display.aspx?s=beatles
>
> no son pdfs (correccion) son archivos .mus
>

Puedes usar python+webkit para hacer un web scrapper. Utilizas
javascript para hacer los clicks y enviarle la información a python.

Acá hay un ejemplo
http://blog.motane.lu/2009/06/18/pywebkitgtk-execute-javascript-from-python/

Saludos
-- 
Linux Registered User # 386081
A menudo unas pocas horas de "Prueba y error" podrán ahorrarte minutos
de leer manuales.


Reply to: