[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: Algunas aclaraciones



On Wed, Sep 26, 2001 at 04:14:03PM +0200, Antonio Castro wrote:
> > Y si en vez de utilizar valores de 1 a 9, se utilizan porcentajes que os
> > parece. El documentalista elegiria valores de 1 a 9, pero el programa los
> > guadaria en relacion a un porcentaje. Ejemplo:
> > 
> > Clave   Peso    %Peso
> > -----   ----    -----
> > A       5       0.25
> > B       5       0.25
> > C       10      0.50
> 
> Creo que no importaría mucho pero un solo digito es muy facil de validar 
> y se puede computar en los cálculos que se necesite. Lo del porcentaje 
> no queda claro.

Tienes razón, igual es más sencillo trabajar con el valor despues de
obtenerlo, es decir, se guarda el numero del 1 a 5. Pero despues a la hora
de hacer busquedas creo que el obtener porcentajes es bastante más util:

a) Refleja si el documento es "monotematico" o es más "generalista". Si un
documento tiene 10 palabras clave y otro 2, esta claro que si buscamos una
palabra clave que ambos comparten, seguramente nos interesa más el segundo
documento, así que debería aparecer antes que el anterior. Por porcentajes,
el primer documento va a tener palabras claves con un valor medio de 0.1 y
el segundo con 0.5, con lo que garantizamos que se priorice el segundo.

b) En un mismo documento las palabras cojen importancia no solo por el valor
asignado sino por el valor del resto de palabras seleccionadas. En dos
documentos puede aparecer la misma palabra con el mismo peso, pero en un
caso el porcentaje puede ser del 0.8 (80%) y en el otro de 0.2. Es decir el
sistema tiene en cuenta el numero de palabras clave, y los valores asignados
en funcion del resto de valores asignados, con lo cual no es tan importante
el valor arbitrario asignado, sino el conjunto de valores asignados a todas
las claves de un documento. Con lo cual es sistema es más objetivo.

> Un porjentaje es una fracción de algo y en este caso es simplemente un
> valor arbitrario.

Si, pero saber que porcentaje del peso de un documento concreto soporta
una clave es más clarificador que saber que numero arbitrario se le ha
asignado sin saber cuantas claves "vecinas" tiene y que rango de valores se
les ha asignado.

Saludos.

-- 
======================================================================
=  "Dicen.." es ya media mentira.                    -Thomas Fuller- =
======================================================================
= Arquitectura-Linux-Japón               Debian GNU/Linux 2.2 Potato =
= http://urreta.hn.org                            Linux User #142642 =
======================================================================



Reply to: