Size: a a a

Natural Language Processing

2020 July 06

FF

Futorio Franklin in Natural Language Processing
Alex Konst
А где найти доку по обозначениям типов связей?
источник

AK

Alex Konst in Natural Language Processing
Спасибо)
источник

ck

cnstntn kndrtv in Natural Language Processing
Привет👋. Правильно ли я понял, что navec не умеет с OOV работать? (как FastText например). И, как следствие, синтаксис и морфология в slovnet ничего не выдадут для этих слов. Как это поправить? Приделать словарь и например редакторское расстояние перед этим?
источник

ck

cnstntn kndrtv in Natural Language Processing
Хочу синтаксис и морфологию стихотворения про Бармаглота)
источник

AK

Alexander Kukushkin in Natural Language Processing
> navec не умеет с OOV работать?
верно

> slovnet ничего не выдадут для этих слов
что-то выдадут по контексту
источник

ck

cnstntn kndrtv in Natural Language Processing
источник

ck

cnstntn kndrtv in Natural Language Processing
источник

AK

Alexander Kukushkin in Natural Language Processing
После применения syntax в markup два токена?
источник

AK

Alexander Kukushkin in Natural Language Processing
Вообще модель обучена на текстах новостей. В примере не текст новости
источник

ck

cnstntn kndrtv in Natural Language Processing
Alexander Kukushkin
После применения syntax в markup два токена?
да. Код из документации. Возможно slovnet_bert лучше бы справилась, но ссылку на модель я не нашел. bert от deeppavlov выдал то что на картинке
источник

ck

cnstntn kndrtv in Natural Language Processing
источник

YB

Yuri Baburov in Natural Language Processing
кстати, у тебя лишняя запятая перед Пырялись
источник

AK

Alexander Kukushkin in Natural Language Processing
cnstntn kndrtv
да. Код из документации. Возможно slovnet_bert лучше бы справилась, но ссылку на модель я не нашел. bert от deeppavlov выдал то что на картинке
Вы видимо разбили на предложения, обработали только первое "Выркались." В целом результат корректный одно слово один корень, он не выводится
источник

ck

cnstntn kndrtv in Natural Language Processing
Yuri Baburov
кстати, у тебя лишняя запятая перед Пырялись
точно. спасибо
источник

YB

Yuri Baburov in Natural Language Processing
ну и конечно излишний uppercase сбивает модели. для поэзии нужно отдельный unknown_case вводить или учить модель на lowercase (но это уменьшит качество).
источник

AI

Andrew Ishutin in Natural Language Processing
text —> lowercase —> truecase —> model ?
источник

ck

cnstntn kndrtv in Natural Language Processing
источник

ck

cnstntn kndrtv in Natural Language Processing
Alexander Kukushkin
Вы видимо разбили на предложения, обработали только первое "Выркались." В целом результат корректный одно слово один корень, он не выводится
Убрал переносы строк, заглавные первые буквы. Sentinsize выделил 5 предложений.
источник

ck

cnstntn kndrtv in Natural Language Processing
А дальше - упорно только одно. У меня есть предположение что дело в OOV
источник

AK

Alexander Kukushkin in Natural Language Processing
в четвёртой строчке вы берете результат для первого предложения
источник