Size: a a a

Natural Language Processing

2021 June 01

K

Ksenia in Natural Language Processing
Вы так далеко не продвинетесь (первый кусок кода в issue) https://github.com/RaRe-Technologies/gensim-data/issues/3
источник

A

Alexander in Natural Language Processing
Буду исправляться, спасибо 🙏
источник

K

Ksenia in Natural Language Processing
Ну в общем-то в первой ссылки надо было просто до storing and loading models промотать 😊
источник

A

Alexander in Natural Language Processing
Но нужна еще модель, ссылка на нее есть во второй статье, но она битая. Простой вариант я нашел в коментах:
источник

A

Alexander in Natural Language Processing
import gensim.downloader as api
model = api.load("word2vec-ruscorpora-300")
источник

A

Alexander in Natural Language Processing
Ксения, спасибо!
источник

K

Ksenia in Natural Language Processing
Не за что 😉
источник

K

Ksenia in Natural Language Processing
А ссылка актуальная на сайте русвекторс лежит, я так понимаю
источник

E

Elena in Natural Language Processing
все модели можно скачать на сайте rusvectors, затем распаковать архив и загрузить bin через Gensim или если это Fasttext, то в самой библиотеке Fasttext
источник

Д

Датасаенсяш... in Natural Language Processing
Всем привет! Мне для задачи аугментации нужно как-то менять начало/окончание произвольного русского слова.

Я немного потестил и заметил, что добавление / удаление / перемешивание букв в моей задаче работает хуже, чем если, например, изменить у слова падеж (веселее -> веселый).

Есть какие-то еще умные способы изменять слово?)
источник

C

Cyril in Natural Language Processing
привет! если продолжать идею с изменением падежа, пробовал ли ты в pymorphy метод inflect? https://pymorphy2.readthedocs.io/en/stable/user/guide.html#inflection он позволяет переходить от одной формы слова к другой
оно?
источник

Д

Датасаенсяш... in Natural Language Processing
Да, я сейчас его и использую) Но мне не совсем понятно, что можно интересного сделать с глаголами, например, поэтому со всеми словами кроме существительных я сейчас делаю просто  какую-то рандомную перестановку
источник

Д

Датасаенсяш... in Natural Language Processing
У меня наверное вопрос не технического характера, а скорее идейного) Я просто никак не могу придумать что можно еще со словами интересного сделать)
источник

DD

David Dale in Natural Language Processing
Перебирай все морфологические признаки, которые есть в pymorphy)
источник

DD

David Dale in Natural Language Processing
А ещё можно менять слова на однокоренные, взятые из какого-нибудь словаря типа ruwordnet или pullenti
источник

C

Cyril in Natural Language Processing
ну да, если идти по однокоренным, чтобы менялась скорее приставка, наверное, можно лемматизировать слово, затем искать его в обратном (ака грамматическом) словаре русского языка и смотреть, какие там рядом слова стоят, брать их и дальше inflect в форму изначального слова
источник

Д

Датасаенсяш... in Natural Language Processing
Спасибо, попробую сейчас
источник

A

Arthur in Natural Language Processing
Ребята, привет
Кто-то сталкивался с такой проблемой?
Вроде тренирует фасттекст модель без ошибок, а уже при предикшине выдает segfault
Сначала думал что из-за размера модели, потом создал файл из двух строчек - то же самое
источник

A

Arthur in Natural Language Processing
Версия: fasttext==0.9.2
источник

E

Elena in Natural Language Processing
почему количество labels 0?
источник