[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: Sobre la ele geminada (era: Re: us funciona l'opció nodeadkeys?)



2013-12-31, 15:59 (+0100); Joan Montané escriu:
> El dia 31 desembre de 2013 14.31, Ernest Adrogué <nfdisco@gmail.com> ha
> escrit:
> 
> > Aquí el tens, a veure si et serveix.
> >
> > ep! i tant!!!
> 
> he fet proves. El problema és a pango, definitivament. Detecta bé les vores
> de paraula (word boundary), però no marca correctament l'inici i final de
> mot.
> 
> Resultat actual:
> ./test_pango
> Enter a test string (finish with RET): a%a b·b
> Language is "ca-es".
> Mark character is "|".
> Word start:         |a%|a |b·|b
> Word end:           a|%a| b|·b|
> Word boundary:      |a|%|a| |b·b|
> 
> Hauria de ser:
> ./test_pango
> Enter a test string (finish with RET): a%a b·b
> Language is "ca-es".
> Mark character is "|".
> Word start:         |a%|a |b·b
> Word end:           a|%a| b·b|
> Word boundary:      |a|%|a| |b·b|
> 
> Ernest, amb el teu permís enviaré el teu programa al bugzilla del GNOME, a
> un dels fils oberts, a veure si aconsegueixo que ho arreglin.

Envia, cap problema.

> Si et veus amb cor, pots mirar perquè marca malament els caràcters d'inici
> i final de mot, si els hi dones la solució serà més fàcil que l'apliquin,
> :) però bé, havent aïllat el problema i podent-lo reproduir ja tenim molt
> de guanyat.

Al fitxer break.c és on fa la divisió de paraules i pel que es veu calcula
els límits de la paraula per una banda, i l'inici i el final per una altra.

A l'únic lloc on assigna is_word_end = TRUE és a la línia 1169, i això només
passa (si llegeixo bé el programa) després de comprovar que el caràcter no
és en cap d'aquestes categories:

G_UNICODE_SPACING_MARK
G_UNICODE_ENCLOSING_MARK
G_UNICODE_NON_SPACING_MARK
G_UNICODE_FORMAT
G_UNICODE_LOWERCASE_LETTER
G_UNICODE_MODIFIER_LETTER
G_UNICODE_OTHER_LETTER
G_UNICODE_TITLECASE_LETTER
G_UNICODE_UPPERCASE_LETTER
G_UNICODE_DECIMAL_NUMBER
G_UNICODE_LETTER_NUMBER
G_UNICODE_OTHER_NUMBER

Suposo que es podria afegir una condició pel cas del català, igual que fan
amb el japonès, però això ho hauria de fer algú que sàpiga el que es fa.

El que veig és que sembla que els límits de paraula i el principi/final de
paraula són conceptes independents.  Potser l'estàndard que dius només és
aplicable en el cas dels límits i no a l'hora de trobar el principi i el
final.

> Si arreglem pango, totes les aplicacions GNOME quedaran resoltes!!! Encara
> tindrem una bona entrada del 2014, :)
> 
> Sobre el locale català apedaçat, he fet proves, i sí, efectivament al bash
> funciona, caldria fer proves per veure si generem altres problemes
> col·laterals. De moment he escrit a la llista del readline, suggerint que
> usin l'alogorisme d'Unicode, a veure com respiren.

Perfecte, sí, suposo que s'hauria de provar el locale d'alguna forma.

Salut.


Reply to: