[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: русские имена файлов для vfat'a



Artem Chuprina wrote:

 BD>   Не utf-16 а ucs-2, имхо.
"Есть мнение", что хранить файлы в UCS-2 невозможно, ибо UCS*
представляют символы в качестве абстрактных чисел, а нам нужны
конкретные байты.  А байты у винды расположены, если точно, то
соответственно UTF-16-le кодированию UCS-2.

Есть мнение что нифига :)
Также есть мнение что надо курить доки, например UTR #17 - Character Encoding Model около раздела Character Encoding Form (CEF) (http://www.unicode.org/reports/tr17/index.html#CharacterEncodingForm)

Для тех кому лень:
UCS2 - 2 байта на уникодовый символ
UTF16 - Переменная длинна, типа UTF8 только вместо байта - слово.

А "абстрактные числа" - это есть Unicode-4 и прочие версии стандарта.

Так вот у виндов ЕМНИП кодировка символов Unicode идет в UCS2 в интеловской последовательности (младший-старший). Хотя может и не в интеловской ... не помню ...



Reply to: