[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

encoding trap



salut,

sunt utilizator de utf-8 şi iubesc utf-8, dar...

La noi se folosesc trei encodinguri: utf-8, iso-8859-2 şi iso-8859-16
Nu am făcut o statistică dar luat pe un eşantion format din cei pe
care îi cunosc cam asta ar fi şi ordinea frecvenţei utilizatorilor.

Problema e că aici e o capcană subtilă care ne priveşte pe toţi:

1. folosind utf-8 am posibilitatea să scriu documente care conţin coduri
de caractere existente atât în iso-8859-2 cât şi în iso-8859-16 astfel
încât documentul nu mai poate fi utilizat de nici unul din utilizatorii
celor doua encodinguri iso
2. dacă scriu documentul folosind iso-8859-2, conversia la utf-8 nu e o
problemă dar poate deveni când fac conversia la iso-8859-16
3. aceaşi problemă de la punctul 2 apare şi în cazul în care scriu docul
folosind iso-8859-16
4. un document corect din punctul de vedere al encodingului ar trebui să
respecte preferinţa utilizatorului pentru encodingul folosit, chestia cu
"folosesc utf-8, nu mă interesează" pică pentru că atât timp cât nu există
o decizie clară că românii trebuie să folosească un anumit encoding orice
restricţie( vezi pct.1 care e capacana aici) devine dictatorială

Poate nu sunt eu bine documentat şi de fapt problema nu există, dar în cazul
ăsta ar trebui să mă deştepte şi pe mine cineva, nu?
În plus mai am o mică problemă, există German, Danish, Serbian, etc. -HOWTO,
care ajută la localizarea pentru limbile respective, ştie cineva ceva despre
vreun Romanian-HOWTO sau ceva similar?

PS: cine vrea să conteste prezenţa lui iso-8859-16 aici să încerce prima
dată un "man charsets", după aia poate un patch la el, dacă poate justifica.



Reply to: