François TOURDE a écrit :
htdig comprend un indexeur de document (rundig) et un moteur de recherche (htsearch). En revanche, je ne sais pas si il est capable d'indexer depuis un système de fichier traditionnel (il faut lui spécifier l'url de départ). Je pense que cela soit être possible en utilisant une url de type file:// mais je ne l'ai jamais testé.Le 12718ième jour après Epoch, nissuacfeneyrol-nospam@free.fr écrivait:Gestion Electronique de Documents[...]1 peu à part, mais pourquoi pas dig ? http://www.scrounge.org/linux/htdig.htmlSi mes souvenirs sont bons, ht://dig est plutôt un collecteur de documents. Il surfe, enregistre, et je crois même qu'il indexe, mais ce dont j'ai besoin est plus proche d'un mélange de catalog et de mnoGoSearch, en gros.
Mais il possède pleins d'avantages :- utilisation de parsers externes : dans mon cas, je l'utilise pour indexer des doc M$ Office (xls,ppt,doc), OoO (sxc,sxw,sxi), swf, pdf, sgml, ps, rtf mais aussi png,tiff,jpeg,gif,mp3 et ogg en utilisant les tags. En gros, tu peux indexer n'importe quel type de document à partir du moment où tu possède un programme qui te permet d'afficher le contenu en texte ou html. - Il existe un kit de francisation (version 3.1) qui permet de faire une recherche à la "française" : mots mal accentués, conjugaisons, synonymes.
J'ai fait des paquets debian (non officiels) pour installer tout ça. Si ça t'intéresse, je te les enverrais.
Mais je vais quand même retourner voir l'URL. Merci en tout cas à tous de vos réponses.