[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: Logiciels d'indexage (was: BTS)



Le Mon, Aug 11, 2003 at 09:47:46AM +0200, Vincent Lefevre a écrit :
> sauf qu'on ne fait pas un grep, car un grep, ça rame. Il faudrait
> un algo par arbre de recherche ou similaire, et dans l'idéal indexer
> tous les suffixes des textes (et pouvoir faire une recherche par
> préfixe). Enfin, quelque chose du genre.
J'ai dis "grep-indexé" et pas grep ! ;)

> Sans index, c'est en temps linéaire en fonction de la taille totale
> des documents (e.g. 100 Mo pour mes archives de mail). Avec un bon
> index (mais qui risque de prendre de la place), ça se fait en temps
> constant (en fait, en temps linéaire en fonction de la longueur du
> terme recherché). Il y a certainement un compromis entre ces deux
> solutions pour avoir un index qui ne prend pas énormément de place
> et une recherche assez rapide (de l'ordre de la seconde).
C'est bien ce que je disait, il faut extraire tout les mots et le
mettres dans une struture de recherche rapide (arbre, hash, ...), leurs
faire correspondre les ID des messages,...
Donc pour 10Mo de mails, tes index vont faire 10-15 Mo

Pour completer mon autre réponse, quand on ne connait pas les besoins,
on net peut pas savoir si il faut donner un tournevis qui ne fait pas ce
qui est demandé ou une chaine de production qui fait beaucoup trop.

Pour en revenir à notre cas, quand je fait un grep dans mes mails, je
trouve effectivement que c'est lent, mais comme je fait ca une fois par
mois grand maximum, je fait avec...
Par contre si je veux gagner 5Mins par mois, doubler l'espace disque
occupé, ca fait chers les 5 minutes. D'autant plus que
contruire/maintenir des index, c'est "cher" en terme de ressources.
 
-- 
12:01 c quoi un bnetd en deux mot svp
12:02 12:01 un b netd

Nicolas Ledez



Reply to: