Re: Moteur de recherche en texte plein supportant bien les caractères latins
On Mon, 23 Jan 2012 17:16:24 +0100
"ROYER Jean-Yves" <royerjy@wanadoo.fr> wrote:
> Je suis nouveau sur cette liste. J'utilise l'informatique depuis plus de
> 50 ans, mais ne suis pas très compétent en informatique.
Haa, c'était donc toi qui changeait les lampes de l'ENIAC!
> nous utilisons le moteur de recherche libre Namazu
C'est seulement un moteur de recherche texte.
> (Debian) que Windows. Il indexe environ 150 sites et 30 000 pages
> essentiellement en français,
Ca, c'est ptêt une erreur: déjà une majorité de sites sont en
Anglais, et lorsqu'on fait une recherche normale, on tombe
de toute façon sur une bonne part de résultat en Anglais.
>
> Y aurait-il un paramétrage de Namazu permettant de ne pas avoir à
> convertir les caractères accentués dans les pages des sites et les bases
> de données MySQL ?
Sèpô, mais il n'est apparemment pas donné comme multilingue, ce qui
laisse à penser qu'il ne traite pas le multi-encodage.
> des formats très divers. Nous sommes incapables de comprendre et
> modifier les scripts PERL et autres sources.
Le PB de PERL est le même que celui de C: on peut tout faire et
n'importe quoi - et si le pgm est mal écrit (ou obfusqué) on peut
passer presque autant de temps à le décrypter qu'à le réécrire.
>
> Y aurait-il d'autres logiciels libres d'indexation et de recherche qui
> répondraient aux mêmes besoins et qui traiteraient correctement les
> caractères accentués tels qu'ils sont rencontrés sur le Web.
celui-ci devrait convenir: http://www.mnogosearch.org/download.html
la version Linux est s/s license GPL et ə des RPMs qu'on peut transcoder
en DEBs avec alien (SI les RPMs sont correctement faits).
--
"He could be a poster child for retroactive birth control."
Reply to: