Re: Возможна ли поддержка тиклем юникода?
Alexey Pechnikov wrote:
> В libunicode-0.7v/include/unicode.h есть
> typedef u_int16_t Uchar;
>
> Разве это не utf-16? Плюс предлагаются функции преобразования utf8 <->
> utf16. Про utf32 в коде не вижу даже упоминания.
Странно, в 0.4 использовались по крайней мере 32-битные символы для
внутреннего представления, да и код рассчитан на >16 бит. Мы точно об одной
и той же библиотеке говорим?
>> >> В этой библиотеке нет функции сравнения строк. Для правильного
>> >> сравнения похоже и нужны мегабайты libicu.
> Возможно, но использование libicu в 4 раза замедляет запросы, это просто
> немыслимо. Ну и размер либы нереально большой.
Энтерпрайз. Ну вот такой он непростой, уникод.
> С iconv понятно, перекодировку внешних данных делаю именно через него, а
> храню все уже в utf8. А как правильно работать с utf8, чтобы избежать
> лишних перекодировок? Поскольку расширение нужно для embedded СУБД, вопрос
> производительности приоритетный. Есть строки в utf8, какие функции
> использовать для достижения максимальной производительности?
А какие функции нужны?
man -k multibyte wide-character 'wide character'
> wchar_t - это два байта, то есть UTF-16, откуда возьмется utf-32?
>> В линуксе, кстати, представление wchar_t будет
>> совпадать с UTF-32.
Reply to: