Size: a a a

Natural Language Processing

2021 April 15

DS

Daria Samsonova in Natural Language Processing
уф сложно)) я так себе советчик, потому что люблю принцип "давайте прочитаем 5 отдельных академических учебников по каждому разделу языкознания, давайте еще в отрыве от комплюктеров")) но коллеги советуют хорошую книгу для лингвистики в НЛП, начините с нее)
источник

DS

Daria Samsonova in Natural Language Processing
чистую лингвистику кстати может и лучше будет именно курсом послушать
источник

IK

Irina Krotova in Natural Language Processing
Да, тоже присоединяюсь к рекомендациям, но это скорее для начинающих книжка по NLP, с уклоном в обработку русского языка, но скорее про классические методы, чем про нейронные сети, т.к. уже относительно давно вышла. Чем прямо по лингвистике.
источник

N

Natalia in Natural Language Processing
искренне рекомендую этот репозиторий, там многое разбирается для русского:
https://github.com/mannefedov/compling_nlp_hse_course
источник

DS

Daria Samsonova in Natural Language Processing
+++
также искренне рекомендую, курс был огонь))
источник

N

Natalia in Natural Language Processing
но да, там уже нет собственно теории
источник

DS

Daria Samsonova in Natural Language Processing
в общем, подытожив, если не глубоко, то будет отлично то, что уже посоветовали, если хочется прям больше теор лингвистики, то возьмите любой учеьник "введение в языкознание" и будет счастье)
источник

N

Natalia in Natural Language Processing
а так лингвистика вполне себе обсуждается и в разделах библии jurafsky&martin, просто некоторым лень вникать
источник

IK

Irina Krotova in Natural Language Processing
Ещё, возможно, Плунгян "Почему языки такие разные", если нужна именно лингвистика, без привязки к NLP. Это научпоп, но не слишком примитивный. Но да, сложно не скатиться в рекомендации почитать Реформатского или Введение в общий синтаксис Тестельца :)

Это примерно как просьба посоветовать один учебник по вообще всей математике, чтобы понимать машинное обучение.
источник

VM

Victor Maslov in Natural Language Processing
я сейчас проверил
$ echo "гладит кота" | ./mystem -cnlsig
гладить=V,несов,пе=непрош,ед,изъяв,3-л
$ echo "ходит по улице" | ./mystem -cnlsig
ходить=V,несов,нп=непрош,ед,изъяв,3-л
mystem успешно определяет переходность глагола, поэтому такая Несуразица сгенерирована не будет
$ echo "love a cat" | ./tree-tagger 
love VBB love
a AT0 a
cat NN1 cat
$ echo "put on a cat" | ./tree-tagger
put VBB put
on PRP on
a AT0 a
cat NN1 cat
а здесь запросто может получиться love on a cat
$ echo "love a cat" | python3 textblob_.py 
love/NN/B-NP/O a/DT/I-NP/O cat/NN/I-NP/O
$ echo "put on a cat" | python3 textblob_.py
put/VB/B-VP/O on/IN/B-PP/B-PNP a/DT/B-NP/I-PNP cat/NN/I-NP/I-PNP
здесь love вообще существительное
источник

VV

VVS VVS in Natural Language Processing
источник

VV

VVS VVS in Natural Language Processing
и будет кота, а не по коту...
источник

Е

Егорка in Natural Language Processing
Большое спасибо за рекомендации !
источник

DS

Daria Samsonova in Natural Language Processing
Тестелец - любовь))
источник

IK

Irina Krotova in Natural Language Processing
Ещё очень внезапно, но у rusgram неплохая вики к проекту: http://rusgram.ru/index, может быть полезно
источник

N

Natalia in Natural Language Processing
а типа если вы русские глаголы с предлогами меняете, то несуразицы не получится, да?
источник

N

Natalia in Natural Language Processing
а то можно и русские примеры похитрее выбрать
источник

DS

Daria Samsonova in Natural Language Processing
давайте уже сойдемся на том, что эта задача на пос-теггере + правилах не решается с адекватным качеством)) там сверху надо еще синтаксический парсер и разметку по семантическим ролям, а на основе этой разметки уже прописать правила сочетаемости)
источник

VV

VVS VVS in Natural Language Processing
и это сложно и дорого 🙂
источник

DS

Daria Samsonova in Natural Language Processing
ага)) и качество все равно будет не оч, потому что норм инструмента для семантической разметки нету)
источник