[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

HtDig y bichos de parecido pelaje



Hola a todos.

Resulta que esoy montando un indexador en un servidor que va a jaubilar a un
RedHat 4.0. Viendo las opciones posibles, me había decidido por el htdig,
pero, aunque hace muchas cosas y tiene opciones muy interesantes, resulta
quen le falta una que para mí es fundamental: no es capaz de indexar
regiones del texto, o lo que es lo mismo, catalogar sólo la parte contenida
entre dos marcas. Por más que me he leido la documentación de htdig, no he
visto que se pueda hacer (he probado con la de Slink y la de potato, aunque
de esta última no he llegado a mirar la documentación tan a fondo). El
servidor condenado a desaparecer tiene un indexador llamado SFgate, pero la
versión más moderna que he encontrado de él es del año 94, y en formato
.tgz, así que asumo que es una especie ya extinguida. El caso es que este
indexador sí era capaz de catalogar sólo entre marcas del texto, lo cual es
fundamental para nosotros.

La pregunta entonces es: ¿puede alguien confirmarme que el HtDig es incapaz
de indexar areas del texto? ¿Existe algún otro indexador de páginas web que
sea capaz de hacerlo y que venga como paquete debian? ¿Busco alguna gota de
ámbar con ADN del SFgate para intentar resucitar la especie?

-- 
Un Saludo

Han Solo
The Rebel Alliance

Conecto, luego existo.
Desconecto, luego insisto.
Soy usuario de infobirria+

P.D. La firma no es mía, sino de uno que trabajaba, precisamente, en M$.
Vivir para ver.


Reply to: