[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: Возможна ли поддержка тиклем юникода?



Hello!

В сообщении от Sunday 18 January 2009 19:35:08 Serhiy Storchaka написал(а):
> Alexey Pechnikov wrote:
> > А где в системе библиотека для работы с юникодом? Рекомендованной вами
> > libunicode в дебиане нет.
>
> Как это нет? Пакеты libunicode0 и libunicode-dev.

Таких пакетов нет. На хосте с ленни:

$ aptitude search libunicode
p   libunicode-japanese-perl
i   libunicode-map-perl
i   libunicode-map8-perl
i   libunicode-maputf8-perl
i A libunicode-string-perl

> > Еще вопрос по последней - в ней используется
> > utf-16, хотя хотелось бы работать со стандартным для линукса utf-8,
>
> Есть и UTF-8, и UTF-16, и UTF-32, разных эндингов, и конвертация в другие
> кодировки (неплохая компактная переносимая альтернатива iconv получается,
> как я погляжу).

Все операции выполняются с utf-16. Это что же, конвертить в utf16 и обратно при каждом 
преобразовании? Стандарт в линуксе это utf-8.

> В этой библиотеке нет функции сравнения строк. Для правильного сравнения
> похоже и нужны мегабайты libicu.

Зачем она тогда нужна? unaccent делать не умеет, сравнивать не умеет... Скопировать строку можно и 
просто как набор байт, для этого можно вообще не знать, что там юникодная строка находится.

Возвращаясь к вопросу - какую стандартную либу дебиана брать для работы с юникодом? Нужно 
преобразование регистра, удаление акцента, сравнение (согласен на базовый юникодное, хотя 
возможность указания кодовой страницы будет полезна).

Best regards, Alexey.


Reply to: