[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: Fwd: Romanizare conform cu regulile Academiei Romane



On Tue, 31 May 2005 12:24:22 +0200
Ionel Mugurel Ciobica <tgakic@chem.tue.nl> wrote:

> On 30-05-2005, at 19h 30'29", Ruset Zeno wrote about "Re: Fwd: Romanizare conform cu regulile Aceademiei Romane"
> > > 
> > > Vedeţi noua variantă.
> > lipseşte conversia la utf-8, 
> 
> De ce este nevoie de conversie?
> 
> > sed face substituţia pe iso-8859-x, cea
> > ce nu e corect, 
> 
> De ce? Orice sir UTF-8 este 8-bit deci compatibil cu iso8859-x,
> deci sed poate sa-l inghita.
> 
motivul este exact răspunsul la ce am afirmat eu legat de testarea
validităţii. De ce sed ar găsi şi substitui corect expresile, dacă
iconv le face varză?

sed -e 's/A/B/g' f1 > f2

A şi B sunt utf-8 sau iso-8859-x?
1. A e utf-8 => cum recunoaşte ce e într-un iso-8859-x mai ales ca x poate
fi ori 2 ori 16
2. A e iso-8859-cit, 2 sau 16?

o dată ce e găsit raspunsul la asta problema se pune similar pentru B, ce
encoding va avea f2?

Un alt motiv este că dacă totul e utf-8 nu mai e nevoie de LC_ALL.

> > în plus (iconv -f ISO-8859-x -t UTF-8 $1 -o $1.bak) face
> > şi testarea validitaţii.
> 
> Ma indoiesc de asta.
> 
> # set LC_ALL ro_RO.ISO-8859-16
> # echo "ăâîşţ-ĂÂÎŞŢ" > z
> # iconv -f ISO-8859-16 -t UTF-8 z -o z.out
> # iconv -f ISO-8859-16 -t UTF-8 z.out -o z.out2
> 
> z.out2 este o varză. iconv nu stie de codare, trebuie specificata (cu
> -f) deci daca i se da UTF-8 ca si cum ar fi iso8859-x il face varza.
> 
corect, m-am corectat în mail-ul trimis imediat după cel în care afirmam asta.

> > eu rămân la părerea mea că comenzile sed trebuie puse într-un fişier sed
> > şi transmis cu sed -f ... pt conversie, face scriptul mai lizibil.
> 
> Asta se poate aranja, face parte din cosmetizare. Vreau doar sa stiu
> daca functioneaza acum, asa cum este, dupa care se aplica startul de
> make-up.
> 
şi asta e corect, dar pe e nevoie să fie lizibil pe perioada cât se
lucrează la el, după e doar o problemă de imagine.




Reply to: