[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: linuxtips



On Sat, Aug 25, 2001 at 05:34:33PM +0200, Antonio Castro wrote:
> 9 Clave prefecta
> 8 Clave muy buena
> 7 Clave bastante util
> 6 Clave de cierta utilidad
> 5 Clave mas bien mediocre
> 4 Clave más bien pobre
> 3 Clave bastante pobre
> 2 Clave muy pobre
> 1 Clave para búsquedas bastante desesperadas.

Me gustaría crear polemica sobre este tema: dar pesos de una forma
completamente subjetiva. (Polemica en el buen sentido de la palabra).

Yo le veo un gran inconveniente y por otro lado una gran intención. El
inconveniente es claro: todos somos diferentes y no valoramos por igual. Una
persona generosa no bajaría del 6 otra tacaña no subiria del 7 y los que
sufren transtornos de personalidad cada día pasarían de un extremo ha otro.

Además de ser dificilmente standarizable, me parece una operación un tanto
incomoda, despues de leerte un tocho manual, haber elegido una serie de
claves ahora tienes que ponerles numeritos... pues lo más probable es que se
ponga a todos un 5 y a alguna importante un 7 (por lo menos es como yo
reaccionaría...)

Por lo tanto, creamos un sistema de elección de palabras subjetivo (esto es
positivo) y un sistema de pesos subjetivo (yo no lo veo tan positivo): y
obtenemos un sistema rigido. ¿En que sentido rigido? pues en el sentido de
que si ya tuviesemos hecha la categorización de buena parte de la
documentación y las busquedas nos diesen cosas raras... que se puede cambiar
para optimizar, la única entrada de datos es la de los usuarios
(documentalistas por afición) y no me parecería bien empezar a toquetear los
valores que se ha ido insertando para que la busqueda de lo que tenga que
dar o lo que se esperaba que tuviese que dar.

Bueno, despues de la crítica me gustaría proponer una linea de actuación
intentando solucionar los problemas que he citado hasta el momento. La idea
es crear datos más objetivos para dar el peso a las claves de tal manera que
se tenga en cuenta tanto criterios subjetivos como objetivos y todo ello se
pueda optimizar a posteriori cuando la herramienta ya este en uso.

a) El documentalista elige la lista de claves (con ayuda del programilla)

b) De la lista que ha elegido en caso de creerlo necesario elige las
palabras que considere más importantes. Normal=x Importante=2x.

c) Introduce el tipo de documento que es. ej: mini-como=100pts, como=200pts,
tutorial=300pts, manual=400pts, libro=500pts. Algo de este estilo.

d) Introduce la fecha de ultima actualización del documento.

e) Contra mayor sea el numero de claves menos peso final va a tener cada
clave. Esto se ha visto en el mini-howto propuesto para lectura, era sobre
trucos, es decir cosas muy concretas de temas muy diversos. Por lo que
aparecen muchas claves, mientras que en un documento monotematico la clave
puede ser una o dos palabras.

Y con estos datos la propia herramienta le da el peso a cada clave en cada
documento analizado:

    *)Imaginemos un mini-como en el que elegimos 4 palabras
clave y destacamos una de ellas como más importante. Como es mini-como le
corresponden 100pts entre "5" claves (una de ellas vale 2x) son 20 pts por
clave, menos la importante que vale 40 pts. Como el mini-como es viejo, hace
dos años que no se actualiza pues le aplicamos una reducción del 5%. Con lo
que nos queda: 1 clave importante= 38 pts , 3 claves normales= 19pts.

    *)Ahora un como monotematico en el que se eligen 2 palabras y no
destacamos ninguna de ellas por encima de la otra. Es un como= 200pts entre
2 claves son 100pts por clave. Como esta al día no sufre ninguna reducción y
nos quedan 2 claves= 100pts.

Espero que se entienda la idea. Por supuesto la elección de 2x para palabras
importantes, los puntos por tipo y tamaño de documento y el porcentaje de
reducción por no estar al día son valores totalmente puestos al azar y que
habría que estudiar bien para que la herramienta funcione bien. Pero estos
valores siempre se van a poder cambiar y gracias a ello en cualquier momento
del proceso se puede ir optimizando la herramienta para que las busquedas
den lo que queremos que den y no cosas sin sentido.

Os toca el contraataque.... ;)
-- 
======================================================================
=  "Dicen.." es ya media mentira.                    -Thomas Fuller- =
======================================================================
= Arquitectura-Linux-Japón               Debian GNU/Linux 2.2 Potato =
= http://urreta.hn.org                            Linux User #142642 =
======================================================================



Reply to: