Re: Proyecto ayuda
----- Mensaje original -----
De: Antonio Castro <acastro@ciberdroide.com>
Fecha: Viernes, Agosto 24, 2001 9:57 am
Asunto: Re: Proyecto ayuda
> On Fri, 24 Aug 2001, Fermín Manzanedo wrote:
>
> Voy a intentar explicar en detalle todo el proceso en base a cinco
> pasos:
>
Por probar y aprender que no quede ;-). Antonio, si tienes este
proceso "implementado" en algún formato (me explico, porque algunas
veces uso unas palabrejas X-PP: lo tienes programado, o en un
documento, o tienes la idea) podemos intentar probar la utilidad de "la
herramienta de extracción de claves (secundarias)". Eres
el "coordinador" de la parte de programación ¿no? ;-) . Entonces, ¿cómo
lo hacemos, <<jefe>>? ;-O.
> -------------------------------------------------------------------
> -----
> 1) Se alimenta la herramienta con una enorme cantidad de documentos,
> técnicos y no técnicos. Interesa gran variedad y gran cantidad.
>
Sin tener mucha idea de cómo funciona estas herramientas, este primer
paso requiere buscar un conjunto de documentos (el número depende de
cómo queramos hacer la prueba) y ponerlos todos en un mismo formato
(xml, txt, pdf, ps,...), ¿no?
> 2) Se obtiene un fichero ...
> 5) Obtención de las palabras que la herramienta señala como más
> interesantesque serían aquellos que tengan un C_INT de valor más alto.
>
Tengo claro el proceso. La programación, más o menos. Creo que una vez
que lo tengamos todo (y claro) se puede seguir el proceso en diferentes
sistemas (PC's) por "curiosidad". Y si la herramienta puede tener
varias versiones (una en C/C++, perl, pyton,... la que se nos ocurra)
podemos comparar sus resultados y sus tiempos (que visto lo que se
pretende hacer con los documentos, el procesado va a ser extenso en
tiempo). Todo esto si no lo tienes ya claro, y conoces estos resultados.
> -------------------------------------------------------------------
> ------
>
> ...
>
> Desde el punto de vista técnico es usar una gran tabla Hash.
>
Siguiendo con el razonamiento: ¿cómo de grande puede ser la tabla? Si
es muy grande puede llegar a ser inviable su tratamiento.
>
> Un saludo
>
> Antonio Castro
>
Nada más. Repetirte que por ganas de hacer y aprender, que no quede ;-).
No tenemos mucho tiempo, pero tampoco tenemos prisa.
¿Alguién más se apunta a la idea? Pue que se lo diga al <<jefe>> (como
siga así Antonio me "mata" }X-P )
Un saludo
Jesús Antonio Martínez Cerezal
jamarcer@inicia.es
_______________________________________________________________
Date de alta en inicia y dispondrás de correo y espacio para tu página
personal. http://inicia.es
Reply to: