[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: literumado kaj vortdividado



Edmund GRIMLEY EVANS wrote:

Mi pensas, ke mi jam menciis ĉi tie programeton, kiun mi uzas por
kontroli literumon kaj aldoni dividstrekojn. Specifi tian programon
estas pli malfacile ol realigi ĝin, sed mi ĵus krei malneton de
manpaĝo, kiun vi povas legi sube.

Mi bonvenigus komentojn.

La programo mem ne jam tute kongruas kun la manpaĝo, sed mi povos
baldaŭ publikigi ĝin, se iu interesiĝas. Temas pri ĉirkaŭ 300 linioj
da Perl-galimatio.

Edmundo

-----------------------------------------------------------------------

espell [-NIVELO] [-d | -l | -a | -s | -v] VORTARO TEKSTOJ ...

NIVELO estas cifero difinanta la akceptemon de la vortrekonilo:

0  Rekoni nur vortojn, kiuj aperas eksplicite en la vortaro.
1  Rekoni ankaŭ kunmetaĵojn el vortoj en la vortaro.
9  Rekoni ĉiujn vortojn per divenado.

La implicita valoro de la NIVELO dependas de la funkcio.

La funkcioj estas:

-d Dividi vortojn en vorterojn (NIVELO=9 implicite).

  {...} kun | indikas plurajn dividojn trovitajn.
  {...} sen | indikas nerekonitan vorton.

  Ekzemple: Sinjoro Bimbam estas sentema poeto.
         -> Sinjor`o {Bimbam} est`as {sent`em`a|sen`tem`a} poet`o.

-l Listigi nerekonitajn vortojn (NIVELO=0 implicite).

-a Diveni aldonojn por la vortaro (NIVELO=9 implicite).

  La eligo konsistas el registro por la vortaro por ĉiu rekonita
  vorto, kiu ne jam estas eksplicite en la vortaro. Se vorto estas
  plurmaniere rekonita, pluraj ebloj aperas en la sama linio. Necesas
  redakti tiajn liniojn, antaŭ ol aldoni ilin al la vortaro.
  Kompreneble, se la kontrolata teksto eble havas erarojn aŭ
  fremdaĵojn, oni volas ĉiuokaze kontroli la eligon de -a.

  Ekzemple: La sendana Bimbam fomas la knipon.
         -> send'an'a4 sen'dan'a4
            Bimbam0
            fom8
            knip'o4

-s Aldoni dividstrekojn (NIVELO=0 implicite).

  La ĝusta maniero dividi Esperantajn vortojn estas temo de eterna
  diskutado. Ĉi tiu programo arbitre aplikas la sekvan proceduron.

  Unue, dividu la vorton laŭ ĝiaj vorteroj, sed ignorante la dividojn
  antaŭ gramatika finaĵo (o a j n e i as is os us u).

  Due, kie mankas divido inter du vokaloj, dividu la konsonantojn
  laŭeble egale, kun pli granda parto post la divido ĉe nepara nombro
  de konsonantoj; tamen, farante tion oni ignoru la literon Ŭ post
  vokalo kaj la literon J post vokalo kaj antaŭ konsonanto.

  Se vorto estas plurmaniere rekonita, unue ĝi estas dividita laŭ ĉiu
  analizo, kaj poste la dividoj estas kunigitaj, tiel ke dividstreko
  eblas nur tie, kie estas divido laŭ ĉiu analizo.

  Ekzemple: nigraharulineto
         -> nig\-ra\-har\-ul\-in\-e\-to
            teo teko tekso teksto ekstra
         -> te\-o te\-ko tek\-so tek\-sto eks\-tra
            majo naŭa kanto pajnto aŭskulti
         -> ma\-jo naŭ\-a kan\-to pajn\-to aŭs\-kul\-ti
            sentema
         -> sente\-ma

-v Eligi vortaron de la uzataj vortoj (NIVELO=9 implicite).

  La eligo konsistas el ĉiuj registroj el la vortaro, kiuj estis
  uzataj dum traktado de la teksto. Traktado de la teksto per la nova
  subvortaro donos samajn rezultojn kiel traktado per la originala
  vortaro.

  Se oni uzas la programon kun -s por komposti dokumenton el fonto en
  CVS, oni eble deziras, ke ankaŭ la vortaro estu en CVS, por ke oni
  ricevu saman rezulton el sama fonto. Per -v oni povas meti en CVS
  nur la bezonatan subvortaron.

La VORTARO havas unu vorton en ĉiu linio, dividitan en vorterojn per
apostrofoj. La lasta signo en ĉiu linio montras la vortspecon:

1 Sen gramatikaj finaĵoj.
2 Ankaŭ kun -N (2 ebloj).
4 Ankaŭ kun -J kaj -N (4 ebloj).
8 Kun ĉiuj finaĵoj de netransitiva verbo (33 ebloj).
9 Kun ĉiuj finaĵoj de transitiva verbo (60 ebloj).
- Prefikso.
/ Sufikso.
0 Neesperanta vorto.

Ekzemple:

mal'pli1
neni'o2
pun'labor'ej'o4
re'lev'iĝ8
sub'ten9
al-
ist/
sappho0

Ĉe nivelo 1 la vortrekonilo akceptas ankaŭ kunmetaĵojn el du vortojn
el la vortaro. Jenaj specoj de kunmetaĵo estas akceptataj:

   RADIKO + (a|e|i|o) + RADIKO + FINAĴO

   PREFIKSO + RADIKO + FINAĴO

   RADIKO + SUFIKSO + FINAĴO

RADIKO signifas ion, kio aperas en la vortaro kun finaĵo `[aeo][124]
aŭ [89], kaj FINAĴO inkluzivas ankaŭ participojn (sume 70 eblojn).

Ekzemple: est`i`bon`o vid`hom`at`a`j`n al`hom`e`n est`ist`as

Ne necesas meti en la vortaron prefikson aŭ sufikson, kiu estas ankaŭ
radiko, ĉar la reguloj same facile kunmetos mal`rid`i kaj hom`in`o el
mal`o kaj in`o kiel el mal- kaj in/. La vortklasoj 0 kaj 1 estas
ekvivalentaj laŭ la nuna regularo: nek sappho0 nek ju1 partoprenas en
kunmetado.

MANKOJ

Eble indus havi pli komplikajn regulojn pri derivado kaj kunmetado.

Estu eble konverti la vortaron al datenbanka dosiero por pli rapida
konsultado.

Estu ia rekonado de apostrofoj kaj dividstrekoj en la teksto.


saluton Edmund.
espell helpus por gnu/linux en Esperanto. Kie estas kodo? eble ni povas meti ĝsur tukseo karieroresumoj deponejo ?

--
Olivier

PS:
Mi jus vidis vi laboras ĉe cambridge. mi estas ĉe cambrige ĝgxis sabato. ni povas provi vidi ni kaj aliaj homoj de 'cambridge esperanto group'?




Reply to: