Size: a a a

Natural Language Processing

2021 April 15

N

Natalia in Natural Language Processing
особенно "увеличилось нельзя"
источник

VM

Victor Maslov in Natural Language Processing
в случае, который я имел в виду, было "осложнённое составное глагольное сказуемое" https://ru.wikipedia.org/wiki/%D0%A1%D0%BA%D0%B0%D0%B7%D1%83%D0%B5%D0%BC%D0%BE%D0%B5#%D0%9E%D1%81%D0%BB%D0%BE%D0%B6%D0%BD%D1%91%D0%BD%D0%BD%D0%BE%D0%B5_%D1%81%D0%BA%D0%B0%D0%B7%D1%83%D0%B5%D0%BC%D0%BE%D0%B5
источник

DS

Daria Samsonova in Natural Language Processing
вы говорили вот это:
"вместо "гладит" мог быть такой глагол, после которого нельзя писать "по коту", не помню как эта фишка называется, но бывает"
нельзя  сказать"по коту", потому что глагол требует управление винительным падежом без предлога, например, глагол "брать" и вот эта фишка про транзитивность.
источник

DS

Daria Samsonova in Natural Language Processing
а осложнение сказуемого (любого, в том числе составного глагольного), да и любого другого члена предложения, это про синтаксическую сочетаемость, и да она определяется не только грамматическим значением слов, но и семантикой, поэтому вам не хватит пос-тэггера, чтобы заменять слова в предложении и не получать несуразицу
источник

DS

Daria Samsonova in Natural Language Processing
проблемы возникнут не только с переходными глаголами, но и с  обстоятельствами, например, потому что не все категории наречий  взаимозаменяемы, такое видно в вашем примере  "увеличилось нельзя"
источник

VM

Victor Maslov in Natural Language Processing
по факту проблем осталось не так много
я специально накопил 50 несуразиц, и 25 из них оказались следствием того, что mystem косячит с падежами, т.е. из примерно 10 видов ошибок половину случаев занимает один вид -- ошибка разметки в обучении

м.б. им пригодятся мои кейсы, и имеет смысл отправить  куда-нить в саппорт на почту, но руки не дошли
источник

N

Natalia in Natural Language Processing
почему сразу ошибка разметки в обучении? а не, например, то, что в наречия собраны вместе прототипические наречия ("сильно", "быстро") и категория состояния/предикативы ("нельзя")? то, что тэггер "косячит" с падежами - во многом ещё и проблема грамматической омонимии
источник

RK

Renat K in Natural Language Processing
А Wordnet/ruWordnet не пробовали прикручивать? На первый взгляд кажется, что с их помощью можно попробовать понизить градус бредовости
источник

Е

Егорка in Natural Language Processing
@SamsonovaDaria не могли бы вы порекомендовать книгу по лингвистике, чтобы лучше понимать предметную область NLP ?
источник

IP

Ian Pilé in Natural Language Processing
+++
источник

N

Natalia in Natural Language Processing
на русском?
источник

IP

Ian Pilé in Natural Language Processing
Лучше и да и нет)
источник

IK

Irina Krotova in Natural Language Processing
Если можно, посоветую Bender - Linguistic Fundamentals for Natural Language Processing
источник

IP

Ian Pilé in Natural Language Processing
Ну типа норм примеры с русским языком и норм примеры не с русским языком
источник

N

Natalia in Natural Language Processing
о да
источник

Е

Егорка in Natural Language Processing
Это не принципиально. Но лучше, чтобы аспекты русского языка были разобраны
источник

Е

Егорка in Natural Language Processing
Спасибо !
источник

N

Natalia in Natural Language Processing
вот этот сборник хороший, но он про комп. лингвистику уже (и я не помню детальности всех тем): https://urss.ru/cgi-bin/db.pl?lang=Ru&blang=ru&page=Book&id=228448
источник

N

Natalia in Natural Language Processing
источник

N

Natalia in Natural Language Processing
в остальном чуть сложнее, т.к. либо будет чистая лингвистика без nlp, либо скорее не книги, а курсы
источник