Re: Парочка "странных" вопросов
You (gsmith@eurocom.od.ua) wrote:
VZ> Согласен, uxterm или Emacs действительно говорят D0 9F для П
VZ> заглавного. Так что это UTF-8, а вот что такое
VZ> http://www.unicode.org/charts/PDF/U0400.pdf ?
Unicode codepoint - число, соответствующее глифу (или не глифу, как
оно там правильно?).
VZ> Там для того же П заглавного 014F. Там написано The Unicode
VZ> Standard 4.1
VZ> Правильно ли я понимаю, что UTF-8 код получается путем каких-то
VZ> манипуляций (каких?)
Описанных в определении кодировки UTF-8.
VZ> со значениями из U0400.pdf превращая кодировку фиксированной
VZ> длины (16 бит ?)
Unicode codepoint - это число. В битах не измеряется. На данный момент
32 бит записать это число хватит.
VZ> на символ, в переменной длины (от 1-го до 4 байт)?
В UTF-8 допустимы последовательности длиннее 4 октетов, но в целом -
да.
VZ> Да, очень слабо знаю что такое Unicode вообще и UTF-8 в
VZ> частности.
На unicode.org есть внятный FAQ.
<#secure method=pgpmime mode=sign>
--
JID: dottedmag@jabber.dottedmag.net
Reply to: