[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: Algunas aclaraciones



On Sat, Sep 29, 2001 at 10:53:07AM +0200, Antonio Castro wrote:
> 
> Ahora te entiendo pero veamos esto. Imagina que en un documento 
> seleccionas solo 4 palabras clave y todas ellas con peso 5.
> Eso les da el 25% a cada clave. Entonces añades una clave que 
> es básicamente un sinónimo de alguna de las anteriores. Igualmente
> lo haces con peso 5. El porcentaje pasaría a ser el 20%. Las
> busquedas sobre cualquiera de estas claves van a resultar 
> perjudicadas solo por el echo de añadir una clave más. 

Bueno, pero segun tengo entendido los documentalistas eligen las palabras
con mucho cuidado y no ponen sinonimos. Si ponen 4 es que 4 son las palabras
mínimas y más importantes.

Por supuesto, yo he comentado la idea y hay que limarla y seguramente mucho.
El camino que creo que tiene más futuro es crear un "valor" que hay que ir
haciendo pruebas teniendo en cuenta diferentes conceptos como el peso (de
cada palabra en cada doc.), el numero de palabras claves (por documento),
el tipo documento (tamaño), si esta actualizado, frecuencia
de selección en las busquedas y un monton de cosas más que habra que ir
ajustando: Tanto que conceptos debe incluir, cuales son más importantes y
habrá que jugar con coeficientes, pero digamos que puede ir probandose a
posteriori...

> Otro ejemplo. Imagina que existe un documento que después de leerlo
> llegas a la conclusión que solo habla de un tema y que tampoco
> resulta especialmente valioso. Por ello pongamos que usas una sola
> clave pero le das como peso el valor 3. Con ello pretendes que
> este documento aparezca como información no excesivamente relevante
> para esa clave a pesar de ser el único tema tratado en ese documento.
> El tema consideras que está mucho mejor tratado en otros documentos.
> Si usas el porcentaje tendrías que esa clave tendría un porcentaje
> de 100%.

Pero utilizar el "peso" como valor que tiene un valor en funcion de si el
documento es bueno, malo, es amplio, escueto, es.... demasiado para un
documentalista. Y altamente subjetivo y hay que intentar crear una
estructura lo más objetiva posible.

> Por ello es importante que los pesos sean valores arbitrarios que 
> indiquen la pertinencia de esa clave a nivel general y no solo a
> nivel de ese documento.

Yo creo que tiene que ser un valor solo sobre ese documento y una manera de
destacar unas claves de otras, ni más ni menos. Es decir volvemos al punto
desde el que tu partiste, pero restringiendo los valores de 1 a 5.

Y si es necesario habría que ver si es necesario crear otro coeficiente para
valorar el documento lo digo para no mezclarlo con el "peso"
que creo tiene una utilidad diferente. Y no se si deberiamos valorar los
documentos, porque no se si es bueno o malo, por que implica una opinion
subjetiva. Yo preferiría basarnos en conceptos más objetivos.

Saludos.

-- 
======================================================================
=  "Dicen.." es ya media mentira.                    -Thomas Fuller- =
======================================================================
= Arquitectura-Linux-Japón               Debian GNU/Linux 2.2 Potato =
= http://urreta.hn.org                            Linux User #142642 =
======================================================================



Reply to: