[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: Moteur de recherche en texte plein supportant bien les caractères latins



On Mon, 23 Jan 2012 17:16:24 +0100
"ROYER Jean-Yves" <royerjy@wanadoo.fr> wrote:

> Je suis nouveau sur cette liste. J'utilise l'informatique depuis plus de
> 50 ans, mais ne suis pas très compétent en informatique.

Haa, c'était donc toi qui changeait les lampes de l'ENIAC!
 
> nous utilisons le moteur de recherche libre Namazu

C'est seulement un moteur de recherche texte.

> (Debian) que Windows. Il indexe environ 150 sites et 30 000 pages
> essentiellement en français,

Ca, c'est ptêt une erreur: déjà une majorité de sites sont en
Anglais, et lorsqu'on fait une recherche normale, on tombe
de toute façon sur une bonne part de résultat en Anglais.

> 
> Y aurait-il un paramétrage de Namazu permettant de ne pas avoir à
> convertir les caractères accentués dans les pages des sites et les bases
> de données MySQL ?

Sèpô, mais il n'est apparemment pas donné comme multilingue, ce qui
laisse à penser qu'il ne traite pas le multi-encodage.

> des formats très divers. Nous sommes incapables de comprendre et
> modifier les scripts PERL et autres sources.

Le PB de PERL est le même que celui de C: on peut tout faire et
n'importe quoi - et si le pgm est mal écrit (ou obfusqué) on peut
passer presque autant de temps à le décrypter qu'à le réécrire.
 
> 
> Y aurait-il d'autres logiciels libres d'indexation et de recherche qui
> répondraient aux mêmes besoins et qui traiteraient correctement les
> caractères accentués tels qu'ils sont rencontrés sur le Web.

celui-ci devrait convenir: http://www.mnogosearch.org/download.html
la version Linux est s/s license GPL et ə des RPMs qu'on peut transcoder
en DEBs avec alien (SI les RPMs sont correctement faits).

-- 
"He could be a poster child for retroactive birth control."


Reply to: