[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: Парочка "странных" вопросов



You (gsmith@eurocom.od.ua) wrote:
 VZ> Согласен, uxterm или Emacs действительно говорят D0 9F для П
 VZ> заглавного.  Так что это UTF-8, а вот что такое

 VZ> http://www.unicode.org/charts/PDF/U0400.pdf ?

Unicode codepoint - число, соответствующее глифу (или не глифу, как
оно там правильно?).

 VZ> Там для того же П заглавного 014F. Там написано The Unicode
 VZ> Standard 4.1

 VZ> Правильно ли я понимаю, что UTF-8 код получается путем каких-то
 VZ> манипуляций (каких?)

Описанных в определении кодировки UTF-8.

 VZ> со значениями из U0400.pdf превращая кодировку фиксированной
 VZ> длины (16 бит ?)

Unicode codepoint - это число. В битах не измеряется. На данный момент
32 бит записать это число хватит.

 VZ> на символ, в переменной длины (от 1-го до 4 байт)?

В UTF-8 допустимы последовательности длиннее 4 октетов, но в целом -
да.

 VZ> Да, очень слабо знаю что такое Unicode вообще и UTF-8 в
 VZ> частности.

На unicode.org есть внятный FAQ.

<#secure method=pgpmime mode=sign>
-- 
JID: dottedmag@jabber.dottedmag.net

Reply to: