Re: Возможна ли поддержка тиклем юникода?
Hello!
В сообщении от Sunday 18 January 2009 19:35:08 Serhiy Storchaka написал(а):
> Alexey Pechnikov wrote:
> > А где в системе библиотека для работы с юникодом? Рекомендованной вами
> > libunicode в дебиане нет.
>
> Как это нет? Пакеты libunicode0 и libunicode-dev.
Таких пакетов нет. На хосте с ленни:
$ aptitude search libunicode
p libunicode-japanese-perl
i libunicode-map-perl
i libunicode-map8-perl
i libunicode-maputf8-perl
i A libunicode-string-perl
> > Еще вопрос по последней - в ней используется
> > utf-16, хотя хотелось бы работать со стандартным для линукса utf-8,
>
> Есть и UTF-8, и UTF-16, и UTF-32, разных эндингов, и конвертация в другие
> кодировки (неплохая компактная переносимая альтернатива iconv получается,
> как я погляжу).
Все операции выполняются с utf-16. Это что же, конвертить в utf16 и обратно при каждом
преобразовании? Стандарт в линуксе это utf-8.
> В этой библиотеке нет функции сравнения строк. Для правильного сравнения
> похоже и нужны мегабайты libicu.
Зачем она тогда нужна? unaccent делать не умеет, сравнивать не умеет... Скопировать строку можно и
просто как набор байт, для этого можно вообще не знать, что там юникодная строка находится.
Возвращаясь к вопросу - какую стандартную либу дебиана брать для работы с юникодом? Нужно
преобразование регистра, удаление акцента, сравнение (согласен на базовый юникодное, хотя
возможность указания кодовой страницы будет полезна).
Best regards, Alexey.
Reply to: