Re: HtDig y bichos de parecido pelaje
On Mon, 20 Sep 1999, Han Solo wrote:
> La pregunta entonces es: ¿puede alguien confirmarme que el HtDig es incapaz
> de indexar areas del texto? ¿Existe algún otro indexador de páginas web que
Yo uso bastante htdig (quiero decir: que lo he montado y me preocupé
bastante de configurarlo convenientemente :-), y no me suena nada de nada
que pueda hacer eso. ¿Probaste swish-e o swish++? Vienen los dos con Debian
y por lo que he mirado, es probable que sí hagan eso :-m
Por otro lado, lo que también puedes hacer es seguir usando htdig pero
definir un filtro para todos los ficheros, como si fuera para
descomprimirlos (pero siendo .html, por ejemplo), que llame a sed como sea,
para devolver a htdig sólo lo que haya entre esas marcas que dices. La
indexación sería más lenta, pero si no son muchos muchos MB la cosa la
puedes resolver así.
Reply to: