> Так вот меня как раз интересует, какими должны быть словари, чтобы "русский" FTS был качественным
на практике.
Тогда нужно стремиться к полноте словарей, но проблему омонимии они не решат - Путин, путин, Путина, путина ? Я не в курсе, кто-нибудь вообще занимается поддержкой машинной морфологии русского языка, имеется ввиду открытой. Я вижу только
aot.ru> Тогда нужно стремиться к полноте словарей,
Почему нужно-то? Вот то, что я написал про совпадающие с "левыми" словами опечатки — как в идеале должен к ним относиться FTS?
> но проблему омонимии они не решат - Путин, путин, Путина, путина ?
Ну так это реальная проблема (в самом языке), а не проблема качества словарей.
> то-нибудь вообще занимается поддержкой машинной морфологии русского языка, имеется ввиду открытой.
А никто, насколько я знаю (по крайней мере, я больше вообще не нашёл ни одного активного проекта). :(
Причём то, что делает AOT, мне крайне не нравится — я вижу, что туда просто внесено много опечаток; кроме того, словарь набит топонимами, фамилиями, диалектизмами, устаревшими словами и "редкими" терминами.
Даже для его, по идее, основной цели (проверки правописания) это всё совсем не хорошо.