[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: Mejorar perfomance comando find





El día 30 de mayo de 2008 12:45, david sastre <d.sastre.medina@gmail.com> escribió:
El día 30 de mayo de 2008 12:35, Abraham Pérez <jockah@gmail.com> escribió:
> Ya que me contestas personalmente, te explico lo mío.
>
> En mi caso tenía que coger un simple fichero con una entrada numérica en
> cada línea, sumarlos y hallar la media. La verdad es que no recuerdo el
> número de registros, pero era bastante alto... En hacer una simple chorrada
> como esa, que ni usaba find ni nada, sólo un fichero de texto, le estaba
> llevando horas!!! Por el contrario, en un puesto corriendo un linux de
> verdad, lo hacía en minutos.
>
> Lo que tú planteas, de correr por ejemplo un .py en un cygwin la verdad es
> que no lo probé. Achaqué el problema al rendimiento del cygwin en sí mismo.
> Ojo que digo rendimiento eh, no digo que no sea una herramienta estupenda
> justo para lo que tú la usas (ssh) pero si la usas sólo para eso, te
> recomiendo el "putty" que corre excelente en Windows y tb es libre: "The
> PuTTY executables and source code are distributed under the MIT licence,
> which is similar in effect to the BSD licence. (This licence is Open Source
> certified and complies with the Debian Free Software Guidelines.)"
>
> Se me ocurre una posible solución, muy guarra la verdad pero que podría
> valerte... si sigues queriéndolo hacer con algo que sea Linux para
> centralizar todo lo posible, prueba a virtualizar una máquina, compartir el
> HD del pc con Windows y acceder vía samba. Es una guarrería... lo sé... pero
> tendrías tu flamante Debian a tu entera disposición :D
>
> El día 30 de mayo de 2008 12:28, david sastre <d.sastre.medina@gmail.com>
> escribió:
>>
>> El día 30 de mayo de 2008 12:16, Abraham Pérez <jockah@gmail.com>
>> escribió:
>> > Mi corta experiencia con cygwin me indica que no es muy válido para
>> > según
>> > qué cosas... una de ellas es lo que tú quieres hacer. En mi caso fue
>> > algo
>> > diferente pero muy parecido, pues tardaba también horas en hacer algo
>> > que
>> > luego un simple .py hacía en apenas un minuto. Como colofón... creo que
>> > te
>> > salría más rentable gastar el tiempo en indagar alguna otra solución que
>> > no
>> > use cygwin. La causa... posiblemente el propio cygwin.
>> >
>> > El día 30 de mayo de 2008 11:53, david sastre
>> > <d.sastre.medina@gmail.com>
>> > escribió:
>> >>
>> >> Hola Lista:
>> >>
>> >> Me han encomendado una tarea sobre unas máquinas Windows consistente
>> >> en eliminar ficheros en una ruta determinada con una antigüedad >= a
>> >> una cantidad determinada.
>> >> Así que, como pienso Debian-mente, se me ocurrió utilizar Cygwin para
>> >> poder usar una consola de verdad.
>> >> El tema: el árbol de directorios a rastrear tiene del orden de 700.000
>> >> archivos, y ocupa unos 7 GB.
>> >> Lo que hago es programar una tarea que lanza bash.exe con un script
>> >> .sh que tiene esta única línea:
>> >>
>> >> find ${RUTA_BORRADO} -mtime +90 -type f -exec rm -f {} \;
>> >>
>> >> En otra máquina utilizada para pruebas, con menos carga de ficheros,
>> >> obtengo estos números:
>> >>
>> >> $ time -p (find ${RUTA_BORRADO} -mtime +5 -type f >> borrables.log)
>> >> real 20.79
>> >> user 3.79
>> >> sys 16.64
>> >>
>> >> $ cat borrables.log | wc -l
>> >> 81260
>> >>
>> >> Sin embargo, en la máquina en producción, la tarea le lleva un par de
>> >> horas largas, lo que supone mucho más de lo esperado.
>> >> No se me ocurre cómo optimizar el rendimiento de este script...¿alguna
>> >> idea de qué puede causar esta lentitud?
>> >>
>> >> Gracias de antemano.
>> >>
>> >> --
>> >>  "Y el escribir a solas, sin finalidad, sin proyecto, porque sí,
>> >> porque es así, puede ofrecer el carácter de una acción trascendente,
>> >> que sólo porque se trata de una humanística acción no podemos llamarla
>> >> sagrada. Mas algo tiene de rito, de conjuro, y más aún, de ofrenda, de
>> >> aceptación del ineludible presente temporal, y de transitar en el
>> >> tiempo, de salirse al encuentro, como él hace, que no nos abandona."
>> >> (María Zambrano. "El hombre y lo divino")
>> >>
>> >>
>> >> --
>> >> To UNSUBSCRIBE, email to debian-user-spanish-REQUEST@lists.debian.org
>> >> with a subject of "unsubscribe". Trouble? Contact
>> >> listmaster@lists.debian.org
>> >>
>> >
>> >
>>
>> Gracias por la respuesta.
>> La cosa es que con Cygwin me puedo conectar por ssh a máquinas que
>> tienen un número limitado de conexiones gráficas, puedo actuar desde
>> consola y me resulta muy cómodo. También es cierto que con el propio
>> Cygwin puede usarse python, ¿has probado algo así?
>>
>>
>>
>> --
>>  "Y el escribir a solas, sin finalidad, sin proyecto, porque sí,
>> porque es así, puede ofrecer el carácter de una acción trascendente,
>> que sólo porque se trata de una humanística acción no podemos llamarla
>> sagrada. Mas algo tiene de rito, de conjuro, y más aún, de ofrenda, de
>> aceptación del ineludible presente temporal, y de transitar en el
>> tiempo, de salirse al encuentro, como él hace, que no nos abandona."
>> (María Zambrano. "El hombre y lo divino")
>
>

Ooooooppps!!! :)

Nah hombre! si yo cuando me apunté hice exactamente lo mismo :D
 

Siento haberte contestado al personal (la respuesta desde gmail obvia
la dirección de la lista...)
Lo que dices de compartir con samba no es viable. La idea es que la
tarea se ejecute en la máquina de forma autónoma y programada.
Putty también lo uso, pero prefiero Cygwin (además, estas máquinas
tienen restringido el ssh "normal", yo entro usando el servicio ssh
que genera Cygwin).

Entiendo... quieres decir que usas el cygwin para entrar a esa máquina, no que lo uses para entrar desde ella. Pues no sé qué más opciones darte chiquillo... como no te curres un programilla en algún lenguaje wapo (Python, por decir uno así al azahar... on incluso PHP!!!), ya no sé... así que mucha suerte!!



Reply to: