[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: vortoj de teksto



 AE,
 

>S.: Saluton,
>S.: 
>S.: tiam vi eble uzu nur tion :
>S.: 
>S.: tr A-Z a-z | sed +'s/[^a-zA-Z]/\n/g' | grep -v '^$' | sort | uniq

mi uzis:
cat dosiero-libro.asc | tr A-Z a-z | sed 's/[^a-zA-Z\-]/\n/g' |
grep -v '^$' | sort | uniq > dosiero1.asc

mi ne scias malsamo por "sed +'s/[^a-zA-Z]/\n/g'" cxu korma "+" estis
mistajpo?

Nu, tiel mi havas dosiero1.asc. Dosiero2.asc estas estas disdivido de
vortoj. Estas alia ol de Baza radikaro de akademio, kiu estas disdivido
en naux grupo...

Do laux mia penso, ne eblas uzi "comm -12" cxar vortoj samaj estos en
malsamaj lokoj. Cxu ne estas fari per alia maniero, ol per comm?

>S.: 
>S.: Tio ne  kalkulos la  oftecon de  le vortoj, ecx  ne ordigos  ilin laux
>S.: ofteco  ;  sed  cxiuj  vortoj  de  la  teksto  simple  estos  alfabete
>S.: listigitaj, sen iu ajn aldonita cifero...
>S.: 
>S.: Poste, per > vi konservu ilin  en 2 dosierojn, kiujn vi efike komparos
>S.: per "comm -12".

Mi ne komprenis tion.

Dankon,
Luiz



Reply to: