[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: vortoj de teksto



Saluton Luiz,

por listigi cxiujn vortojn de dosiero, listigitaj laux ofteca ordo, vi ekzemple uzu ion tian :

zcat /usr/share/doc/HOWTO/en-txt/Esperanto-HOWTO.gz | tr A-Z a-z | sed 's/[^a-zA-Z]/\n/g' | grep -v '^$' | sort | uniq -c | sort -rn | nl

Rapida klarigo :
1) tr A-Z a-z
   minuskligu
2) sed 's/[^a-zA-Z]/\n/g'
   anstatauxigu cxiujn mal-literojn per nov-linia karaktero
3) grep -v '^$'
   forigu malplenajn liniojn
4) sort
   ordigu laux angla alfabeto
5) uniq -c
   kunigu samajn vortojn, nombrante ilin :-)
6) sort -rn
   ordigu por unue montri la plej oftajn
7) nl
   nombru la vortojn

Certe estas pli simplaj eblecoj !
Laux via imago kaj nuntempa emo :-)

Mi esperas ke helpos al vi,

Bonan ludadon,
  seb


... dimanche 19 à 20h36, luiz écrivait :
> AE,
> 
>  Per wc, #wc dosiero.asc, oni scias kiom da linioj, vortoj, kaj
>  literoj/signoj la dosiero enhavas.
> 
>  Pro komparo de libroj: http://www.lujz.org/libro/node2.html mi sxatus
>  koni programon aux skripton, kiu povus listigi cxiujn la vortojn, unu
>  po linio. Gxi povas ecx listigi "vivi" kaj "vivas" sed ja mi pensas, ke
>  se gxi ekzistas, gxi ne listigas vortojn samajn.
> 
>  Tio helpos min finigi la komparon. Cxu iu konas similan programon? Cxu
>  eble ekzistas programon, kiu faras cxion, tio estas, komparas du
>  dosieron?
> 
>  Dankon pro helpo,
>  Luiz
> 
> 



Reply to: