[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: ISO-8859-1 -> UTF-8?



Tore Ericsson wrote:
lördag 16 december 2006 13:16 skrev Johan Segernas:


Jag har tills vidare slagit mig till ro och rekommenderar att intallera med ISO som sysdefault eftersom tiden inte tycks vara mogen för generell övergång till UTF annat än om man är en tillräcklig expert på saken och/eller accepterar att konvertera textfiler "motormanuellt" titt som tätt mellan olika datorsystem. Jag stöder i och för sig till 100 % en framtida universell övergång, men då måste nog alla vara med (inkusive MS)?! Se vidare http://www.mail-archive.com/debian-user-swedish@lists.debian.org/msg10118.html med mera i saken.

Jag ser inget större problem med att använda olika teckenkodningar i olika textfiler, Emacs brukar utan problem detektera om filen använder ISO-8859-1 eller UTF8.

Jag har själv använt UTF8 sedan RedHat Linux 8 var nytt, och det är ju ett antal år sedan.

Enligt Wikipedia blev Microsoft Windows NT 3.1 det första operativsystemet att stödja Unicode när det lanserades i mars 1993, över 13 år sedan. Så Microsoft är en föregångar i det här fallet.


Jag tycker mig ha erfarit att det inte hindrar att många applikationer med databashanterare "inuti" använder UTF-8 för sin interna teckenrepresentation (exempel: Digikam, Textpattern, ...). Sådana applikationer är dock väl uttestade för riktig teckenvisning även på datorer som kör t.ex. ISO-8859 och användaren förblir omedveten om "problemet".


Ofta används UCS4/UTF32 eller UTF16 internt iaf under körning. Fördelen med UCS4 är att alla tecken tar lika stor plats, så det blir såledel enklare att indexera strängar och liknande.

Mikael



Reply to: