[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: Ejemplo de documento



On Tue, Sep 25, 2001 at 10:58:01PM +0200, Antonio Castro wrote:
> > 
> > Nó, la localización del original és:
> >   http://www.laespiral.org/le-cvs/cvs/laespiral/www/documentacion/recetas/1-100/receta2.xml?rev=1.3&content-type=text/vnd.viewcvs-markup
> 
> La URL original de un documento es algo conflictivo. Dentro de un tiempo
> habría que actualizar muchas URLs. Son datos que exigen una labor de
> mantenimiento. Hay que buscar la forma de evitar tener que estar 
> pendientes de los posibles cambios en URLs de documentos.

Yo no haria diferencias entre si es la version original o un mirror o esta
en otro formato diferente al original, lo importante es decir dondo y que
formato.

Yo pondria:

Localizacion: http://a.com/pagina.html (html); http://b.org/page.xml (xml;
http://otro.es/index.php (php)

que es algo ampliable y rectificable con facilidad. En cuanto a un metodo de
comprobacion de si las urls son correctas seria el metodo de "frase unica".
Si anadimos una frase larga que solo aparezca en este documento, es
facil comprobar si el documento sigue ahi, por ejemplo haciendo una busqueda
en google restringiendo a la url que tenemos (normalmente el site). Si
existe "busqueda afortunada", sigue ahi, sino es que ya no esta. Habria que
perfeccionar el tema, pero es factible.

Despues ese mismo sistema podria generar urls candidatas de tener ese mismo
docuemnto y con la aprobacion humana, pasarian a formar parte de
"localizacion".

> Descriptor             Peso Jerarquia TipoDescriptor
> ---------------------- ---- --------- ---------------
> DISPOSITIVO LOOPBACK     9     =        NA
> MONTAJE DE DISPOSITIVOS  7     =        V*N
> CD-ROM                   6     =        N	
> ISO 9660                 6     =        NA
> KERNEL                   5     +        N
> 
> Bueno yo desde mi perspectiva de desarrollador veo  la intrducción
> de datos ya estructurados como algo necesario. Ignoro de que otra
> forma podrían estructurarse estas cosas a posteriori.

Lo del peso lo entiendo, aunque habria que ver si los documentalistas lo ven
util o comodo de utilizar. Lo de jerarquia me rompe por completo no entiendo
lo que quieres decir con que kernel es (+). Y lo de TipoDescriptor no le veo
"utilidad" por lo menos a priori, quizas lo entiendo si lo utilizas para
relacionar claves compuestas con sus claves primarias. De tal manera que si
alguien busca "Loopback" le diga que por si no hay ningun documento con esa
clave, pero si con una compuesta que contiene a "loopback".

Encuanto a estructurar datos a posteriori, propongo dos caminos
complementarios:

a) relaciones generadas entre las propias claves al ser elegidas de forma
repetitiva con los mismos "vecinos". Es decir que si normalmente aparece  la
clave A y la B, juntas en varios documentos "algo" tendra que decir este
hecho.

b) Una especie de busqueda que aprenda del usuario. Si los usuarios al
buscar "A" eligen con mayor frequencia el 3º resultado de la lista de
resultados, el propio programa de busqueda tiene que priorizar este
documento y la proxima vez deberia aparecer en 1º lugar, o por lo menos
deberia subir un puesto.

c) Y lo que ya comente hace tiempo de que el conjunto de las claves de
documentos que contienen la palabra buscada, debe auto-clasificarse, en
principio asociandose con los que mas palabras comparten (lo que comento en
el punto "a") e incluso utilizando las estructuras jerarquicas con las que
se clasificaran todas las claves.

Saludos.
-- 
======================================================================
=  "Dicen.." es ya media mentira.                    -Thomas Fuller- =
======================================================================
= Arquitectura-Linux-Japón               Debian GNU/Linux 2.2 Potato =
= http://urreta.hn.org                            Linux User #142642 =
======================================================================



Reply to: