Re: vortoj de teksto

To: debian-eo <debian-esperanto@lists.debian.org>
Subject: Re: vortoj de teksto
From: luiz portella <lfpor@lujz.org>
Date: Mon, 20 Oct 2003 06:43:43 -0200
Message-id: <[🔎] 20031020084343.GA16287@kafka.lujz.org>
Mail-followup-to: luiz portella <lfpor@lujz.org>, debian-eo <debian-esperanto@lists.debian.org>
In-reply-to: <[🔎] 20031020060105.GB31087@sebastounet.dyndns.org>
References: <[🔎] 20031020041736.GA15937@kafka.lujz.org> <[🔎] 20031020060105.GB31087@sebastounet.dyndns.org>

 AE,
 

>S.: Saluton,
>S.: 
>S.: tiam vi eble uzu nur tion :
>S.: 
>S.: tr A-Z a-z | sed +'s/[^a-zA-Z]/\n/g' | grep -v '^$' | sort | uniq

mi uzis:
cat dosiero-libro.asc | tr A-Z a-z | sed 's/[^a-zA-Z\-]/\n/g' |
grep -v '^$' | sort | uniq > dosiero1.asc

mi ne scias malsamo por "sed +'s/[^a-zA-Z]/\n/g'" cxu korma "+" estis
mistajpo?

Nu, tiel mi havas dosiero1.asc. Dosiero2.asc estas estas disdivido de
vortoj. Estas alia ol de Baza radikaro de akademio, kiu estas disdivido
en naux grupo...

Do laux mia penso, ne eblas uzi "comm -12" cxar vortoj samaj estos en
malsamaj lokoj. Cxu ne estas fari per alia maniero, ol per comm?

>S.: 
>S.: Tio ne  kalkulos la  oftecon de  le vortoj, ecx  ne ordigos  ilin laux
>S.: ofteco  ;  sed  cxiuj  vortoj  de  la  teksto  simple  estos  alfabete
>S.: listigitaj, sen iu ajn aldonita cifero...
>S.: 
>S.: Poste, per > vi konservu ilin  en 2 dosierojn, kiujn vi efike komparos
>S.: per "comm -12".

Mi ne komprenis tion.

Dankon,
Luiz

Reply to:

Follow-Ups:
- Re: vortoj de teksto
  - From: Sebastien Montagne <sebastien.montagne@netcourrier.com>

References:
- Re: vortoj de teksto
  - From: luiz portella <lfpor@lujz.org>
- Re: vortoj de teksto
  - From: Sebastien Montagne <sebastien.montagne@netcourrier.com>

Prev by Date: Re: vortoj de teksto
Next by Date: Re: vortoj de teksto
Previous by thread: Re: vortoj de teksto
Next by thread: Re: vortoj de teksto
Index(es):
- Date
- Thread