[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: Fwd: Romanizare conform cu regulile Academiei Romane



On 31-05-2005, at 15h 52'58", Ruset Zeno wrote about "Re: Fwd: Romanizare conform cu regulile Academiei Romane"
> > 
> motivul este exact răspunsul la ce am afirmat eu legat de testarea
> validităţii. De ce sed ar găsi şi substitui corect expresile, dacă
> iconv le face varză?

Dar nu foloseşte nimeni iconv. Iar sed nu ştie de codări. Aşa că el ia
frumoşel caracterele şi le înlocuieşte. Scriptul meu pur şi simplu
testează dacă este vorba despre UTF-8 sau nu. Şi în funcţie de asta
înlocuieşte î cu â sau reprezentarea lor UTF-8 ("Ă şi Ž" pentru î şi 
"Ă şi ˘" pentru â).

> 
> sed -e 's/A/B/g' f1 > f2
> 
> A şi B sunt utf-8 sau iso-8859-x?

Lui sed nu-i pasă.

> 1. A e utf-8 => cum recunoaşte ce e într-un iso-8859-x mai ales ca x poate
> fi ori 2 ori 16

â şi î despre care este vorba aici sînt la fel în mai toate
iso-8859-x, x=1,2,15,16. Iar dacă A este UTF-8 atunci şi B este în
UTF-8.

> 2. A e iso-8859-cit, 2 sau 16?

Cum am zis î şi â sînt la fel în iso-8859-x, x-1,2,15,16.

> o dată ce e găsit raspunsul la asta problema se pune similar pentru B, ce
> encoding va avea f2?

Acelaşi ca şi A. Nu inţeleg ce ai cu codările astea. Cum am mai zis
sed nu ştie de ele, deci lasă ce găseşte. In plus, în fişier text nu
se specifică nicăieri codarea deci nici noi nu trebuie să ne legăm la
cap.

> Un alt motiv este că dacă totul e utf-8 nu mai e nevoie de LC_ALL.

Scriptul meu lu foloseşte locale tocmai că e făcut să meargă şi pe
UTF-8 şi pe clasicul iso-8859.

> > Asta se poate aranja, face parte din cosmetizare. Vreau doar sa stiu
> > daca functioneaza acum, asa cum este, dupa care se aplica startul de
> > make-up.
> > 
> şi asta e corect, dar pe e nevoie să fie lizibil pe perioada cât se
> lucrează la el, după e doar o problemă de imagine.

Chestie de opinie.

Mugurel



Reply to: