[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: Proyecto ayuda



----- Mensaje original -----
De: Antonio Castro <acastro@ciberdroide.com>
Fecha: Viernes, Agosto 24, 2001 9:57 am
Asunto: Re: Proyecto ayuda

> On Fri, 24 Aug 2001, Fermín Manzanedo wrote:
> 
> Voy a intentar explicar en detalle todo el proceso en base a cinco 
> pasos:
> 

Por probar y aprender que no quede ;-). Antonio, si tienes este 
proceso "implementado" en algún formato (me explico, porque algunas 
veces uso unas palabrejas X-PP: lo tienes programado, o en un 
documento, o tienes la idea) podemos intentar probar la utilidad de "la 
herramienta de extracción de claves (secundarias)". Eres 
el "coordinador" de la parte de programación ¿no? ;-) . Entonces, ¿cómo 
lo hacemos, <<jefe>>? ;-O.

> -------------------------------------------------------------------
> -----
> 1) Se alimenta la herramienta con una enorme cantidad de documentos,
> técnicos y no técnicos. Interesa gran variedad y gran cantidad.
> 
Sin tener mucha idea de cómo funciona estas herramientas, este primer 
paso requiere buscar un conjunto de documentos (el número depende de 
cómo queramos hacer la prueba) y ponerlos todos en un mismo formato 
(xml, txt, pdf, ps,...), ¿no?

> 2) Se obtiene un fichero ...
> 5) Obtención de las palabras que la herramienta señala como más 
> interesantesque serían aquellos que tengan un C_INT de valor más alto.
> 
Tengo claro el proceso. La programación, más o menos. Creo que una vez 
que lo tengamos todo (y claro) se puede seguir el proceso en diferentes 
sistemas (PC's) por "curiosidad". Y si la herramienta puede tener 
varias versiones (una en C/C++, perl, pyton,... la que se nos ocurra) 
podemos comparar sus resultados y sus tiempos (que visto lo que se 
pretende hacer con los documentos, el procesado va a ser extenso en 
tiempo). Todo esto si no lo tienes ya claro, y conoces estos resultados.
> -------------------------------------------------------------------
> ------
> 
> ... 
> 
> Desde el punto de vista técnico es usar una gran tabla Hash.
> 
Siguiendo con el razonamiento: ¿cómo de grande puede ser la tabla? Si 
es muy grande puede llegar a ser inviable su tratamiento.
> 
> Un saludo
> 
> Antonio Castro
> 

Nada más. Repetirte que por ganas de hacer y aprender, que no quede ;-).
No tenemos mucho tiempo, pero tampoco tenemos prisa.

¿Alguién más se apunta a la idea? Pue que se lo diga al <<jefe>> (como 
siga así Antonio me "mata" }X-P )

Un saludo
Jesús Antonio Martínez Cerezal
jamarcer@inicia.es

_______________________________________________________________
Date de alta en inicia y dispondrás de correo y espacio para tu página 
personal. http://inicia.es



Reply to: