[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: Algunas aclaraciones



On Sat, 29 Sep 2001, Ibon Urretavizcaya wrote:

> On Wed, Sep 26, 2001 at 04:14:03PM +0200, Antonio Castro wrote:
> > > Y si en vez de utilizar valores de 1 a 9, se utilizan porcentajes que os
> > > parece. El documentalista elegiria valores de 1 a 9, pero el programa los
> > > guadaria en relacion a un porcentaje. Ejemplo:
> > > 
> > > Clave   Peso    %Peso
> > > -----   ----    -----
> > > A       5       0.25
> > > B       5       0.25
> > > C       10      0.50
> > 
> > Creo que no importaría mucho pero un solo digito es muy facil de validar 
> > y se puede computar en los cálculos que se necesite. Lo del porcentaje 
> > no queda claro.
> 
> Tienes razón, igual es más sencillo trabajar con el valor despues de
> obtenerlo, es decir, se guarda el numero del 1 a 5. Pero despues a la hora
> de hacer busquedas creo que el obtener porcentajes es bastante más util:
> 
> a) Refleja si el documento es "monotematico" o es más "generalista". Si un
> documento tiene 10 palabras clave y otro 2, esta claro que si buscamos una
> palabra clave que ambos comparten, seguramente nos interesa más el segundo
> documento, así que debería aparecer antes que el anterior. Por porcentajes,
> el primer documento va a tener palabras claves con un valor medio de 0.1 y
> el segundo con 0.5, con lo que garantizamos que se priorice el segundo.

Estupendo creo que discutir el concepto de peso entre alguién con visión
de desarrollador y alguien con visión de documentalista puede ayudar
mucho a clarificar entre todos que es lo que queremos usar como peso.
 
> b) En un mismo documento las palabras cojen importancia no solo por el valor
> asignado sino por el valor del resto de palabras seleccionadas. En dos
> documentos puede aparecer la misma palabra con el mismo peso, pero en un
> caso el porcentaje puede ser del 0.8 (80%) y en el otro de 0.2. Es decir el
> sistema tiene en cuenta el numero de palabras clave, y los valores asignados
> en funcion del resto de valores asignados, con lo cual no es tan importante
> el valor arbitrario asignado, sino el conjunto de valores asignados a todas
> las claves de un documento. Con lo cual es sistema es más objetivo.

Ahora te entiendo pero veamos esto. Imagina que en un documento 
seleccionas solo 4 palabras clave y todas ellas con peso 5.
Eso les da el 25% a cada clave. Entonces añades una clave que 
es básicamente un sinónimo de alguna de las anteriores. Igualmente
lo haces con peso 5. El porcentaje pasaría a ser el 20%. Las
busquedas sobre cualquiera de estas claves van a resultar 
perjudicadas solo por el echo de añadir una clave más. 

Otro ejemplo. Imagina que existe un documento que después de leerlo
llegas a la conclusión que solo habla de un tema y que tampoco
resulta especialmente valioso. Por ello pongamos que usas una sola
clave pero le das como peso el valor 3. Con ello pretendes que
este documento aparezca como información no excesivamente relevante
para esa clave a pesar de ser el único tema tratado en ese documento.
El tema consideras que está mucho mejor tratado en otros documentos.
Si usas el porcentaje tendrías que esa clave tendría un porcentaje
de 100%.

Por ello es importante que los pesos sean valores arbitrarios que 
indiquen la pertinencia de esa clave a nivel general y no solo a
nivel de ese documento.



Un saludo

Antonio Castro

+--+--+--+--+--+--+--+--+--+--+--+--+--+--+--+--+--+--+--+--+--+--+--+--+--+
        /\     /\      Ciberdroide Informática (Tienda de Linux)
          \\W//            <<< http://www.ciberdroide.com >>>
	 _|0 0|_                                                    
+-oOOO--(___o___)--OOOo----------------------------------------------------+ 
|  . . . . U U . . . . Antonio Castro Snurmacher  acastro@ciberdroide.com  |  
|  . . . . . . . . . .                                                     | 
+()()()----------()()()----------------------------------------------------+
| *** 1.700 sitios clasificados por temas sobre Linux en ***Donde_Linux*** |
| <<< http://www.ciberdroide.com/misc/donde/dondelinux.html >>>            |
+--+--+--+--+--+--+--+--+--+--+--+--+--+--+--+--+--+--+--+--+--+--+--+--+--+




Reply to: