Re: Proyecto ayuda
On Wed, 22 Aug 2001, Javier Viñuales Gutiérrez wrote:
> > cuando no se tiene en cuenta y más adelante se quiere cambiar. Por
> > experiencia, se convierte en un problema "dificilísimo" de manejar.
>
> Has resumido lo que yo traté de explicar mcuho mejor que yo, gracias :)
> Totalmente de acuerdo con este punto de vista, esa era mi idea inicial.
Entonces todo claro y todos de acuerdo. En mi opinión el sistema debería
ser capaz de trabajar en cualquier idioma desde el primer momento pero
inicialmente empezaremos procesando documnentación española y si vemos
que el invento está maduro animaremos a otros grupos para que empiecen
a hacerlo en otros idiomas.
He estado dandole vueltas a la parte que va a suponer más carga de
trabajo. Tengo claro que la elección de claves es una tarea para seres
humanos pero tengo una idea y salvo que Maribel lo vea de otra forma
quizás no resulte imprescindible leerse todo un documento para sacar un
buen conjunto de palabras claves disponiendo de cierta ayuda automatizada.
No se trataría de sustituir el criterio de una persona por el criterio
de una máquina o programa.
Leer todo un documento lleva mucho tiempo y conviene trabajar en la
generación de herramientas de ayuda para que la labor de los
documentalistas resulte lo menos dura posible.
En principio una persona que domine el tema del que trate un documento
puede elegir unas pocas palabras clave bastante buenas simplemente
sabiendo de que trata el documento . Si el documento es largo como
por ejemplo una guía, esto resultará insuficiente, porque convendría
incluir un buen número de palabras clave relativas a todos los temas
tratados en ese amplio documento.
Mediante técnicas de hash es posible confeccionar un listado de palabras
y su frecuencia de uso en el conjunto de todos los documentos.
Posteriormente analizado un documento en particular se puede poner de
relieve la existencia de palabras usadas con una frecuencia comparativamente
mayor en ese documento en particular. Este sistema permitiría destacar la
presencia de palabras especialmente significativas en un documento.
Si en el listado inicial relativo al uso de palabras en todos los
documentos incluimos el procesado de textos no técnicos se conseguirá
que cualquier palabra técnica resalte muchísimo más con el uso de esta
herramienta.
Ni que decir que las palabras que aparecen con demasiada frecuencia en
una gran variedad de documentos serían desechadas de forma automática
como candidatas a claves sin riesgo alguno. (artículos, pronombres,
palabras de uso muy frecuente, no pasarían esa barrera)
Ignoro si con este planteamiento se puede lograr un ahorro de tiempo del
80% o solo del 5% pero en cualquier caso merecerá la pena porque no me
parece dificil de hacer y es susceptible de mejoras mediante los
refinamientos que su uso aconseje a criterio de los documentalistas.
Soy el primero en admitir que los procedimientos 100% automáticos no son
buenos pero siempre hay que procurar automatizar todo aquello que sea
posible. La elección de buenas claves es una labor para humanos pero
hay que facilitar esa tarea y creo que podría merecer mucho la pena hacer
algún experimento en la dirección que acabo de indicar.
Un saludo
Antonio Castro
+--+--+--+--+--+--+--+--+--+--+--+--+--+--+--+--+--+--+--+--+--+--+--+--+--+
/\ /\ Ciberdroide Informática (Tienda de Linux)
\\W// <<< http://www.ciberdroide.com >>>
_|0 0|_
+-oOOO--(___o___)--OOOo----------------------------------------------------+
| . . . . U U . . . . Antonio Castro Snurmacher acastro@ciberdroide.com |
| . . . . . . . . . . |
+()()()----------()()()----------------------------------------------------+
| *** 1.700 sitios clasificados por temas sobre Linux en ***Donde_Linux*** |
| <<< http://www.ciberdroide.com/misc/donde/dondelinux.html >>> |
+--+--+--+--+--+--+--+--+--+--+--+--+--+--+--+--+--+--+--+--+--+--+--+--+--+
Reply to: