[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: [HS] lignes uniques



JusTiCe8 wrote:

Bonjour,

[...]


UUOP = Useless Use Of *Perl* ;)

lhh $ time perl -ne 'print if!$l{$_}++' <tmp/bench &>/dev/null

real    0m0.047s
user    0m0.040s
sys     0m0.010s
lhh $ time awk '!l[$0]++' <tmp/bench &>/dev/null

real    0m0.027s
user    0m0.030s
sys     0m0.000s

aarrff ton bench est truqué :), vu le temps d'exécution hyper court, l'init de l'interpréteur perl fausse les résultats. Refait la même chose avec un fichier de plusieurs Mo, voir 100 Mo à 1 Go pour voir et là ce sera significatif.

C'est pas pasque c vendredi qu'on peut tout s'permettre non plus  ! ;)

Petit test fait avec mes archives de la listes (issuent de mozilla), le fichier fait 104 Mo, contenant 24852 messages.
Mes versions :
Perl 5.6.1-8.6 (v5.6.1 built for i386-linux)
gawk  3.1.0-3 (GNU Awk 3.1.0)
Les deux sont issu des paquets binaires.

résultats :

perl :
real    0m15.581s
user    0m11.150s
sys    0m1.210s

gawk:
real    13m33.680s
user    12m38.560s
sys    0m6.970s

Je pense que là Perl s'en tire plutôt bien ;)
Je tiens à préciser que la charge était le même à peu de choses près durant les 2 exécutions (en place publique ? :) ).

A+,

 J8.






Reply to: