Re: vortoj de teksto
Saluton Luiz,
por listigi cxiujn vortojn de dosiero, listigitaj laux ofteca ordo, vi ekzemple uzu ion tian :
zcat /usr/share/doc/HOWTO/en-txt/Esperanto-HOWTO.gz | tr A-Z a-z | sed 's/[^a-zA-Z]/\n/g' | grep -v '^$' | sort | uniq -c | sort -rn | nl
Rapida klarigo :
1) tr A-Z a-z
minuskligu
2) sed 's/[^a-zA-Z]/\n/g'
anstatauxigu cxiujn mal-literojn per nov-linia karaktero
3) grep -v '^$'
forigu malplenajn liniojn
4) sort
ordigu laux angla alfabeto
5) uniq -c
kunigu samajn vortojn, nombrante ilin :-)
6) sort -rn
ordigu por unue montri la plej oftajn
7) nl
nombru la vortojn
Certe estas pli simplaj eblecoj !
Laux via imago kaj nuntempa emo :-)
Mi esperas ke helpos al vi,
Bonan ludadon,
seb
... dimanche 19 à 20h36, luiz écrivait :
> AE,
>
> Per wc, #wc dosiero.asc, oni scias kiom da linioj, vortoj, kaj
> literoj/signoj la dosiero enhavas.
>
> Pro komparo de libroj: http://www.lujz.org/libro/node2.html mi sxatus
> koni programon aux skripton, kiu povus listigi cxiujn la vortojn, unu
> po linio. Gxi povas ecx listigi "vivi" kaj "vivas" sed ja mi pensas, ke
> se gxi ekzistas, gxi ne listigas vortojn samajn.
>
> Tio helpos min finigi la komparon. Cxu iu konas similan programon? Cxu
> eble ekzistas programon, kiu faras cxion, tio estas, komparas du
> dosieron?
>
> Dankon pro helpo,
> Luiz
>
>
Reply to: