Artem Chuprina wrote:
BD> Не utf-16 а ucs-2, имхо. "Есть мнение", что хранить файлы в UCS-2 невозможно, ибо UCS* представляют символы в качестве абстрактных чисел, а нам нужны конкретные байты. А байты у винды расположены, если точно, то соответственно UTF-16-le кодированию UCS-2.
Есть мнение что нифига :)Также есть мнение что надо курить доки, например UTR #17 - Character Encoding Model около раздела Character Encoding Form (CEF) (http://www.unicode.org/reports/tr17/index.html#CharacterEncodingForm)
Для тех кому лень: UCS2 - 2 байта на уникодовый символ UTF16 - Переменная длинна, типа UTF8 только вместо байта - слово. А "абстрактные числа" - это есть Unicode-4 и прочие версии стандарта.Так вот у виндов ЕМНИП кодировка символов Unicode идет в UCS2 в интеловской последовательности (младший-старший). Хотя может и не в интеловской ... не помню ...