Re: Транслит
Hello!
On Thursday 05 November 2009 12:04:36 Serhiy Storchaka wrote:
> Вы неправильно понимаете принцип работы soundex. Если по-разному звучащие
> слова получат одинаковый код — не беда, они отсеются на втором этапе.
> Главное — чтобы слова, звучащие похоже, получили одинаковый код. И лучше
> захватить немного лишнего, чем пропустить возможные варианты. Потому-то
> soundex игнорирует гласные и h (которая иногда не произносится, а иногда
> является модификатором s, c или t), не различает c, k и s (потому лишь, что
> английская c иногда произносится как k, а иногда s). Кроме первой буквы,
> конечно (но из-за особенностей русского произношения и первые буквы можно
> иногда объединять). Если хотите большую избирательность — используйте другие
> алгоритмы, более сложные.
В москве "о" зачастую звучит как "а". В Нижнем Новгороде - как "оо". Потому мне
предложенный вами вариант замен представляется неприемлемым. Это не
привязываясь к реализации самого хэша soundex. Насчет более сложных алгоритмов -
вы можете назвать такие, которые дают лучший результат? Сама по себе сложность
отнюдь не является достоинством. Было бы интересно сравнить.
Best regards, Alexey Pechnikov.
http://pechnikov.tel/
Reply to: