[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: Транслит



Hello!

On Thursday 05 November 2009 12:04:36 Serhiy Storchaka wrote:
> Вы неправильно понимаете принцип работы soundex. Если по-разному звучащие 
> слова получат одинаковый код — не беда, они отсеются на втором этапе. 
> Главное — чтобы слова, звучащие похоже, получили одинаковый код. И лучше 
> захватить немного лишнего, чем пропустить возможные варианты. Потому-то 
> soundex игнорирует гласные и h (которая иногда не произносится, а иногда 
> является модификатором s, c или t), не различает c, k и s (потому лишь, что 
> английская c иногда произносится как k, а иногда s). Кроме первой буквы, 
> конечно (но из-за особенностей русского произношения и первые буквы можно 
> иногда объединять). Если хотите большую избирательность — используйте другие 
> алгоритмы, более сложные.

В москве "о" зачастую звучит как "а". В Нижнем Новгороде - как "оо". Потому мне 
предложенный вами вариант замен представляется неприемлемым. Это не 
привязываясь к реализации самого хэша soundex. Насчет более сложных алгоритмов - 
вы можете назвать такие, которые дают лучший результат? Сама по себе сложность
отнюдь не является достоинством. Было бы интересно сравнить.

Best regards, Alexey Pechnikov.
http://pechnikov.tel/

Reply to: