Re: Utidad para indizar contenidos
El 29/08/08, L. Paz <rpz011@gmail.com> escribió:
> Hola.
>
> Expongo mi problema.
> Necesitaría que me recomendarais un programa/utilidad que permitiera
> la indexación del contenido de varios directorios residentes en varias
> particiones de varios discos duros de un servidor. Estos directorios
> contienen colecciones de ficheros en varios formatos. La mayor parte
> -más de un 95%- son ficheros de texto (ascii crudo, documentos de
> varias versiones del viejo WordPerrect, documentos de casi todas la
> versiones de MsWord, pdf, odt). También hay algunas ficheros de
> presentaciones, hojas de calculo, sonido y video. Son ficheros
> generados desde mediados de los 80, que estaban dispersos por
> diferentes servidores y que estamos tratando de reunir en una sola
> máquina para construir una especie de archivo digital. Se trata de
> unos 310.000 archivos y, por supuesto, no tenemos recursos para darles
> ningún tratamiento documental (p.ej., asignarles metadatos),
> organizarlos en colecciones y contruir un repositorio digital al
> estilo de los gestionados por DSpace, CDS-Invenio, Archon y similares.
> Lo que buscamos es una herramienta que nos permita realizar búsquedas
> de texto en el título y/o contenido de los ficheros (para los de
> sonido y video, me conformaría que los localizara por el título) y que
> tuviera una interfaz de interrogación/presentación de resultados lo
> más amigable posible para usuarios finales (no informáticos, ni
> documentalistas). Los ideal sería que las consultas se pudieran
> realizar a través de una página web.
>
el único que conozco para eso es htdig, hasta donde recuerdo, no era
complicado de instalar y configurar... aunque lo hice hace varios
años.
Al menos te serviría para los archivos de texto plano, no me acuerdo
si podía buscar dentro de los binarios (.doc y esas cosas)... aunque
eso ya te toca investigarlo a vos ;-)
--
http://fishblues.blogspot.com/
http://gonzalor.blogspot.com/
Yo estoy en forma: redondo es una forma! :D
Reply to: