[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

literumado kaj vortdividado



Mi pensas, ke mi jam menciis ĉi tie programeton, kiun mi uzas por
kontroli literumon kaj aldoni dividstrekojn. Specifi tian programon
estas pli malfacile ol realigi ĝin, sed mi ĵus krei malneton de
manpaĝo, kiun vi povas legi sube.

Mi bonvenigus komentojn.

La programo mem ne jam tute kongruas kun la manpaĝo, sed mi povos
baldaŭ publikigi ĝin, se iu interesiĝas. Temas pri ĉirkaŭ 300 linioj
da Perl-galimatio.

Edmundo

-----------------------------------------------------------------------

espell [-NIVELO] [-d | -l | -a | -s | -v] VORTARO TEKSTOJ ...

NIVELO estas cifero difinanta la akceptemon de la vortrekonilo:

0  Rekoni nur vortojn, kiuj aperas eksplicite en la vortaro.
1  Rekoni ankaŭ kunmetaĵojn el vortoj en la vortaro.
9  Rekoni ĉiujn vortojn per divenado.

La implicita valoro de la NIVELO dependas de la funkcio.

La funkcioj estas:

-d Dividi vortojn en vorterojn (NIVELO=9 implicite).

   {...} kun | indikas plurajn dividojn trovitajn.
   {...} sen | indikas nerekonitan vorton.

   Ekzemple: Sinjoro Bimbam estas sentema poeto.
          -> Sinjor`o {Bimbam} est`as {sent`em`a|sen`tem`a} poet`o.

-l Listigi nerekonitajn vortojn (NIVELO=0 implicite).

-a Diveni aldonojn por la vortaro (NIVELO=9 implicite).

   La eligo konsistas el registro por la vortaro por ĉiu rekonita
   vorto, kiu ne jam estas eksplicite en la vortaro. Se vorto estas
   plurmaniere rekonita, pluraj ebloj aperas en la sama linio. Necesas
   redakti tiajn liniojn, antaŭ ol aldoni ilin al la vortaro.
   Kompreneble, se la kontrolata teksto eble havas erarojn aŭ
   fremdaĵojn, oni volas ĉiuokaze kontroli la eligon de -a.

   Ekzemple: La sendana Bimbam fomas la knipon.
          -> send'an'a4 sen'dan'a4
             Bimbam0
             fom8
             knip'o4

-s Aldoni dividstrekojn (NIVELO=0 implicite).

   La ĝusta maniero dividi Esperantajn vortojn estas temo de eterna
   diskutado. Ĉi tiu programo arbitre aplikas la sekvan proceduron.

   Unue, dividu la vorton laŭ ĝiaj vorteroj, sed ignorante la dividojn
   antaŭ gramatika finaĵo (o a j n e i as is os us u).

   Due, kie mankas divido inter du vokaloj, dividu la konsonantojn
   laŭeble egale, kun pli granda parto post la divido ĉe nepara nombro
   de konsonantoj; tamen, farante tion oni ignoru la literon Ŭ post
   vokalo kaj la literon J post vokalo kaj antaŭ konsonanto.

   Se vorto estas plurmaniere rekonita, unue ĝi estas dividita laŭ ĉiu
   analizo, kaj poste la dividoj estas kunigitaj, tiel ke dividstreko
   eblas nur tie, kie estas divido laŭ ĉiu analizo.

   Ekzemple: nigraharulineto
          -> nig\-ra\-har\-ul\-in\-e\-to
             teo teko tekso teksto ekstra
          -> te\-o te\-ko tek\-so tek\-sto eks\-tra
             majo naŭa kanto pajnto aŭskulti
          -> ma\-jo naŭ\-a kan\-to pajn\-to aŭs\-kul\-ti
             sentema
          -> sente\-ma

-v Eligi vortaron de la uzataj vortoj (NIVELO=9 implicite).

   La eligo konsistas el ĉiuj registroj el la vortaro, kiuj estis
   uzataj dum traktado de la teksto. Traktado de la teksto per la nova
   subvortaro donos samajn rezultojn kiel traktado per la originala
   vortaro.

   Se oni uzas la programon kun -s por komposti dokumenton el fonto en
   CVS, oni eble deziras, ke ankaŭ la vortaro estu en CVS, por ke oni
   ricevu saman rezulton el sama fonto. Per -v oni povas meti en CVS
   nur la bezonatan subvortaron.

La VORTARO havas unu vorton en ĉiu linio, dividitan en vorterojn per
apostrofoj. La lasta signo en ĉiu linio montras la vortspecon:

1 Sen gramatikaj finaĵoj.
2 Ankaŭ kun -N (2 ebloj).
4 Ankaŭ kun -J kaj -N (4 ebloj).
8 Kun ĉiuj finaĵoj de netransitiva verbo (33 ebloj).
9 Kun ĉiuj finaĵoj de transitiva verbo (60 ebloj).
- Prefikso.
/ Sufikso.
0 Neesperanta vorto.

Ekzemple:

mal'pli1
neni'o2
pun'labor'ej'o4
re'lev'iĝ8
sub'ten9
al-
ist/
sappho0

Ĉe nivelo 1 la vortrekonilo akceptas ankaŭ kunmetaĵojn el du vortojn
el la vortaro. Jenaj specoj de kunmetaĵo estas akceptataj:

    RADIKO + (a|e|i|o) + RADIKO + FINAĴO

    PREFIKSO + RADIKO + FINAĴO

    RADIKO + SUFIKSO + FINAĴO

RADIKO signifas ion, kio aperas en la vortaro kun finaĵo `[aeo][124]
aŭ [89], kaj FINAĴO inkluzivas ankaŭ participojn (sume 70 eblojn).

Ekzemple: est`i`bon`o vid`hom`at`a`j`n al`hom`e`n est`ist`as

Ne necesas meti en la vortaron prefikson aŭ sufikson, kiu estas ankaŭ
radiko, ĉar la reguloj same facile kunmetos mal`rid`i kaj hom`in`o el
mal`o kaj in`o kiel el mal- kaj in/. La vortklasoj 0 kaj 1 estas
ekvivalentaj laŭ la nuna regularo: nek sappho0 nek ju1 partoprenas en
kunmetado.

MANKOJ

Eble indus havi pli komplikajn regulojn pri derivado kaj kunmetado.

Estu eble konverti la vortaron al datenbanka dosiero por pli rapida
konsultado.

Estu ia rekonado de apostrofoj kaj dividstrekoj en la teksto.



Reply to: