Re: Транслит
Alexey Pechnikov wrote:
> А вы, кроме Москвы, где-нибудь еще бывали? К примеру, волгари "окают", и
> "о" отнюдь не звучит похоже на "а", в отличие от московского выговора. С
> другими заменами тоже весьма спорный вопрос.
Да я и в Москве последний раз был 20 лет назад.
Вы неправильно понимаете принцип работы soundex. Если по-разному звучащие
слова получат одинаковый код — не беда, они отсеются на втором этапе.
Главное — чтобы слова, звучащие похоже, получили одинаковый код. И лучше
захватить немного лишнего, чем пропустить возможные варианты. Потому-то
soundex игнорирует гласные и h (которая иногда не произносится, а иногда
является модификатором s, c или t), не различает c, k и s (потому лишь, что
английская c иногда произносится как k, а иногда s). Кроме первой буквы,
конечно (но из-за особенностей русского произношения и первые буквы можно
иногда объединять). Если хотите большую избирательность — используйте другие
алгоритмы, более сложные.
Reply to:
- Follow-Ups:
- Re: Транслит
- From: Alexey Pechnikov <pechnikov@mobigroup.ru>