[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: Proyecto ayuda



On Wed, 22 Aug 2001, Javier Viñuales Gutiérrez wrote:

> > cuando no se tiene en cuenta y más adelante se quiere cambiar. Por 
> > experiencia, se convierte en un problema "dificilísimo" de manejar.
> 
> Has resumido lo que yo traté de explicar mcuho mejor que yo, gracias :)
> Totalmente de acuerdo con este punto de vista, esa era mi idea inicial.

Entonces todo claro y todos de acuerdo. En mi opinión el sistema debería 
ser capaz de trabajar en cualquier idioma desde el primer momento pero 
inicialmente empezaremos procesando documnentación española y si vemos 
que el invento está maduro animaremos a otros grupos para que empiecen
a hacerlo en otros idiomas. 

He estado dandole vueltas a la parte que va a suponer más carga de 
trabajo. Tengo claro que la elección de claves es una tarea para seres
humanos pero tengo una idea y salvo que Maribel lo vea de otra forma 
quizás no resulte imprescindible leerse todo un documento para sacar un 
buen conjunto de palabras claves disponiendo de cierta ayuda automatizada. 

No se trataría de sustituir el criterio de una persona por el criterio
de una máquina o programa. 

Leer todo un documento lleva mucho tiempo y conviene trabajar en la
generación de herramientas de ayuda para que la labor de los 
documentalistas resulte lo menos dura posible. 

En principio una persona que domine el tema del que trate un documento
puede elegir unas pocas palabras clave bastante buenas simplemente 
sabiendo de que trata el documento . Si el documento es largo como 
por ejemplo una guía, esto resultará insuficiente, porque convendría 
incluir un buen número de palabras clave relativas a todos los temas 
tratados en ese amplio documento. 

Mediante técnicas de hash es posible confeccionar un listado de palabras
y su frecuencia de uso en el conjunto de todos los documentos.

Posteriormente analizado un documento en particular se puede poner de 
relieve la existencia de palabras usadas con una frecuencia comparativamente
mayor en ese documento en particular. Este sistema permitiría destacar la 
presencia de palabras especialmente significativas en un documento. 

Si en el listado inicial relativo al uso de palabras en todos los 
documentos incluimos el procesado de textos no técnicos se conseguirá
que cualquier palabra técnica resalte muchísimo más con el uso de esta
herramienta.

Ni que decir que las palabras que aparecen con demasiada frecuencia en
una gran variedad de documentos serían desechadas de forma automática
como candidatas a claves sin riesgo alguno. (artículos, pronombres,
palabras de uso muy frecuente, no pasarían esa barrera)

Ignoro si con este planteamiento se puede lograr un ahorro de tiempo del
80% o solo del 5% pero en cualquier caso merecerá la pena porque no me
parece dificil de hacer y es susceptible de mejoras mediante los 
refinamientos que su uso aconseje a criterio de los documentalistas.

Soy el primero en admitir que los procedimientos 100% automáticos no son
buenos pero siempre hay que procurar automatizar todo aquello que sea 
posible. La elección de buenas claves es una labor para humanos pero
hay que facilitar esa tarea y creo que podría merecer mucho la pena hacer 
algún experimento en la dirección que acabo de indicar.



Un saludo

Antonio Castro

+--+--+--+--+--+--+--+--+--+--+--+--+--+--+--+--+--+--+--+--+--+--+--+--+--+
        /\     /\      Ciberdroide Informática (Tienda de Linux)
          \\W//            <<< http://www.ciberdroide.com >>>
	 _|0 0|_                                                    
+-oOOO--(___o___)--OOOo----------------------------------------------------+ 
|  . . . . U U . . . . Antonio Castro Snurmacher  acastro@ciberdroide.com  |  
|  . . . . . . . . . .                                                     | 
+()()()----------()()()----------------------------------------------------+
| *** 1.700 sitios clasificados por temas sobre Linux en ***Donde_Linux*** |
| <<< http://www.ciberdroide.com/misc/donde/dondelinux.html >>>            |
+--+--+--+--+--+--+--+--+--+--+--+--+--+--+--+--+--+--+--+--+--+--+--+--+--+




Reply to: