Size: a a a

Конкурсы Telegram

2019 November 29

MF

Max Fomichev in Конкурсы Telegram
sorrge
Классифицирует хорошо?
достаточно. на английском - отлично. на русском -хорошо, но нужен стеммер, я его решил не использовать - времени не хватит
источник

MF

Max Fomichev in Конкурсы Telegram
Таки кто-нибудь еще поделится своими результатами?
источник

s

sorrge in Конкурсы Telegram
Если ты на крестах делаешь, то есть же библиотека небольшая для стемминга
источник

s

sorrge in Конкурсы Telegram
По скорости у меня +- так же
источник

s

sorrge in Конкурсы Telegram
snowball стеммер
источник

s

sorrge in Конкурсы Telegram
Тут упоминался уже однажды
источник

MF

Max Fomichev in Конкурсы Telegram
это какая ж? есть говно, есть mystem и есть  pymorphy2, но он на пайтоне
источник

MF

Max Fomichev in Конкурсы Telegram
snowball - это не стеммер
источник

MF

Max Fomichev in Конкурсы Telegram
в понимании русской морфологии
источник

MF

Max Fomichev in Конкурсы Telegram
я уже лет 10 собираюсь написать свой bsd-licensed аналог pymorphy2 на с++, но времнеи нет :(
источник

d

dm in Конкурсы Telegram
Max Fomichev
в понимании русской морфологии
А зачем понимать русскую морфологию если достаточно понимать что две формы одного слова - это одно слово
источник

d

dm in Конкурсы Telegram
Конечно зависит от ембединга, но сноуболла мне вполне хватило
источник

Dp

Danila plee in Конкурсы Telegram
да мне тоже
источник

Dp

Danila plee in Конкурсы Telegram
вообще конечно чем быстрее работает алгоритм тем меньше точность
источник

Dp

Danila plee in Конкурсы Telegram
тут нужна золотая середина :)
источник

Dp

Danila plee in Конкурсы Telegram
а кто ни будь пробовал через пересечение бинарных деревьев вычислять треды?
источник

Dp

Danila plee in Конкурсы Telegram
мне кажется самый быстрый способ
источник

Dp

Danila plee in Конкурсы Telegram
моментально должен вычислять все треды
источник

Dp

Danila plee in Конкурсы Telegram
это в случае если комуто дорого и медленно итерировать)
источник

d

dm in Конкурсы Telegram
Бинарных деревьев чего?
источник