[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: Возможна ли поддержка тиклем юникода?



Alexey Pechnikov wrote:
> Поддержка юникода оказывается все большей проблемой...

Уникод тут ни при чём. Сортировка букв в определённом языке, а тем более
строк — совершенно отдельная задача.

Прежде всего решение зависит от языка. В разных языках общие буквы могут
иметь разный порядок в алфавите.

Потом, обычно стоит задача сортировки слов или строк, а не только отдельных
букв. Буква «ё» при словарной сортировке занимает ту же позицию, что и «е».
Т.е. слова на «е» и «ё» идут вперемешку.

Если же сортируются многословные строки, то тут правила ещё сложнее.
Игнорируются артикли, всякие «фон» и «де» в именах, игнорируются пробелы и
знаки пунктуации («триединый» идёт перед «три коровы», но после «три
банана»). Отдельно стоит задача сортировки словосочетаний на разных языках.
Если в строке встречаются числа, то порядок зависит от величины этих чисел
(«файл-100» идёт после «файл-22»).

В общем решение полностью зависит от задачи. Где-то может и порядок записи
чисел в римской системе следует учитывать.


Reply to: