Телеграмм чат группы natural_language_processing страница 662

parrot.ru

Рейтинг популярных групп и каналов

В рейтинге участвует:

групп:

каналов:

Виртуальный сервер на SSD - недорого!

Аренда выделенных и виртуальных серверов (VDS/VPS), хостинг, аренда IP-адресов, администрирование, круглосуточная поддержка

qwarta.ru подробнее

Резервное копирование с проверкой на вирусы!!!

Удобный сервис создания резервных копий на любой сервер сети интернет. Отслеживайте изменения, проверяйте на вирусы. Надежно защитите свой бизнес!

go.backupland.com

Выбираете сервер? Любая конфигурация на заказ!

Аренда физических серверов любых конфигураций под любые запросы - 1С бухгалтерия, игровые сервера, нагруженные проекты, интернет-магазины!

qwarta.ru подробнее

Size: a a a

Natural Language Processing

1563 membersпожаловаться на группу

2020 May 12

M

M&M in Natural Language Processing

Спасибо!!!

источник

19:42пожаловаться #1

ZZ

Zigfrid Zvezdin in Natural Language Processing

В онлайн-словаре Multitran ищут специалистов для разработки морфологии https://www.multitran.com/m.exe?a=351

> Морфология используется в словаре для поиска слов в любой форме, а также поиска фраз, содержащих заданное слово.
Чем точнее морфологическая модель для данного языка, тем более релевантной будет выдача словаря в этих режимах.

Это что, до сих пор не автоматизировано кем-нибудь в какой-нибудь библиотеке?

Словарь Мультитран

Multitran.com: Free online dictionary in English, German, French, Spanish

источник

23:29пожаловаться #2

YB

Yuri Baburov in Natural Language Processing

Zigfrid Zvezdin

В онлайн-словаре Multitran ищут специалистов для разработки морфологии https://www.multitran.com/m.exe?a=351

> Морфология используется в словаре для поиска слов в любой форме, а также поиска фраз, содержащих заданное слово.
Чем точнее морфологическая модель для данного языка, тем более релевантной будет выдача словаря в этих режимах.

Это что, до сих пор не автоматизировано кем-нибудь в какой-нибудь библиотеке?

Словарь Мультитран

Multitran.com: Free online dictionary in English, German, French, Spanish

"Для некоторых языков, например, русского и английского, морфология на сайте относительно проработана.
Для других, например, немецкого и украинского, морфология есть, но она неточная и нуждается в исправлении.
В остальных языках морфологии нет, и её нужно создать."
Вообще, в UD есть морфология, но только в рамках заполненного датасета (110к словоформ для русского, из более 5 млн). Есть ли общий датасет морфологии? Вроде бы нету.

источник

23:42пожаловаться #3

YB

Yuri Baburov in Natural Language Processing

"Для некоторых языков, например, русского и английского, морфология на сайте относительно проработана.
Для других, например, немецкого и украинского, морфология есть, но она неточная и нуждается в исправлении.
В остальных языках морфологии нет, и её нужно создать."
Вообще, в UD есть морфология, но только в рамках заполненного датасета (110к словоформ для русского, из более 5 млн). Есть ли общий датасет морфологии? Вроде бы нету.

есть библиотечки, которые статистически/нейросетями определяют параметры для неизвестных слов, да. А им нужно выверять и исправлять, чтобы точная была база, а не слепо доверять библиотечкам.

источник

23:44пожаловаться #4

SS

Sergey Sikorskiy in Natural Language Processing

Да и потом народ до сих пор не может договориться сколько падежей в уже "хорошо проработанном" русском языке. Некоторые источники утверждают что 15.

источник

23:47пожаловаться #5

2020 May 13

YB

Yuri Baburov in Natural Language Processing

Sergey Sikorskiy

Да и потом народ до сих пор не может договориться сколько падежей в уже "хорошо проработанном" русском языке. Некоторые источники утверждают что 15.

по морфологическим характеристикам вроде бы можно выделить 10: 6 стандартных + 3 устаревших формы + звательный, ну и может парочку исключений, а по синтактико-семантическим — хоть миллион, по одному падежу на каждый глагол.
но в системе типа multitran нужно показывать привычную классификацию из учебников, чтобы всем понятно было.

источник

00:28пожаловаться #6

AE

Alex Egorov in Natural Language Processing

Падежей может быть любое количество, всё равно в _реальных_ системах нужно использовать прагматику... )))

источник

01:07пожаловаться #7

SS

Sergey Sikorskiy in Natural Language Processing

Падежей может быть любое количество, всё равно в _реальных_ системах нужно использовать прагматику... )))

Сколько падежей в прагматике? :)

источник

01:16пожаловаться #8

AE

Alex Egorov in Natural Language Processing

Сколько падежей в прагматике? :)
Например, у слова кофе - один. ))))

источник

04:24пожаловаться #9

SS

Sergey Sikorskiy in Natural Language Processing

Думаю что очень многие в этом чате с этим не согласятся 🙂

источник

07:28пожаловаться #10

SS

Sergey Sikorskiy in Natural Language Processing

В этом чате где-то год тому назад обсуждался падеж второго существительного во фразе “из грязи в князи”. Аналогично “в президенты”.
Предлог "в" требует после себя либо винительного, либо локатив …
А тут …

источник

07:40пожаловаться #11

KP

Kavita Patil in Natural Language Processing

Suggest any free certificate course for NLP using python

источник

07:49пожаловаться #12

A

Ankur in Natural Language Processing

Kavita Patil

Suggest any free certificate course for NLP using python

Yes pls...do let me know if you get something Kavita

источник

13:51пожаловаться #13

Н

Наташа in Natural Language Processing

Здравствуйте, проблема с NamesExtractor(). Версия natasha 1.1.0

источник

14:06пожаловаться #14

Н

Наташа in Natural Language Processing

Подскажите, что делать в такой ситуации

источник

14:07пожаловаться #15

VR

Vasya Ridikat in Natural Language Processing

Здравствуйте, проблема с NamesExtractor(). Версия natasha 1.1.0

там в строчке перед Process finished написано, передайте в конструктор morph

источник

14:08пожаловаться #16

Н

Наташа in Natural Language Processing

Просто у моего партнера по проекту на другом компьютере работает без этого

источник

14:09пожаловаться #17

V

Vlad in Natural Language Processing

Значит у него старая версия библиотеки, на предыдущей версии передавать аргумент в конструктор не нужно

источник

14:15пожаловаться #18

Н

Наташа in Natural Language Processing

Спасибо, сейчас попробуем исправить

источник

14:16пожаловаться #19

IJ

IL Jah in Natural Language Processing

Всем привет. Что я не так делаю - сравнил производительность yargy и tomita на Linux, Python3, задача получение физлица и организации(в наташе из коробки, в томите самописные правила), список из 1500 текстов. По данным измерений - в среднем tomita парсит за 0.27 сек, в то время, как наташа - за 0.07 сек. Yargy+Natasha в 3+ раза быстрее, чем Tomita,

с чем это может быть связано, с необходимостью постоянно дергать бинарь томиты или криворукими правилами для томиты, и как тогда другие люди меряют, все те, кто утверждает, что tomita быстрее, чем yargy? Тут кто нибудь сравнивал производительность двух этих инструментов? Подскажите, пзл, кто имел боевой опыт, в какую сторону копать

источник

16:05пожаловаться #20