Телеграмм чат группы natural_language

Size: a a a

Natural Language Processing

3198 membersпожаловаться на группу

2021 July 04

S in Natural Language Processing

Tool or api available?

источник

18:05пожаловаться #1

2021 July 05

El Non in Natural Language Processing

Привет всем. Какие ресурсы (кроме хабра и , возможно, arxiv-sanity) вы читаете, чтобы быть уверенными, что вы не упускаете ничего важного, происходящего в ml ( особенно в области nlp)?

источник

11:30пожаловаться #2

k ravi in Natural Language Processing

Anyone know about pos tagging

источник

11:37пожаловаться #3

k ravi in Natural Language Processing

I have recently started working on chatbot building if anyone interested message me it is helpful for me

источник

11:40пожаловаться #4

Elena in Natural Language Processing

papers with code, huggingface для NLP

источник

11:48пожаловаться #5

Nikolay V. Shmyrev in Natural Language Processing

на рудера можно подписаться

источник

11:49пожаловаться #6

Andrew Valukhov in Natural Language Processing

Всем привет! Хочу попросить совета. Работаю в команде, занимающейся роботом-оператором, который общается с клиентами по заранее сформированным сценариям. Сценарий в данном случае - это набор состояний робота, между которыми он переключается в зависимости от ответов человека.

Сейчас есть идея автоматизировать процесс создания такого сценария под новые продукты. Самый желаемый итог, чтобы, получив от заказчика транскрипции диалогов живого оператора с клиентом, на выходе формировалось что-то похожее на сценарий. То есть, как понимаю, мне нужно выделять основные вопросы и обращения оператора и далее анализировать различные варианты того, как человек отвечает.

Из исходных данных есть около 1000 диалогов, отдельно реплики оператора, отдельно - клиента. Есть временные отметки каждой репилики, то есть можно восстановить порядок разговора. Буду признателен за подсказку любых пайплайнов/решений/библиотек/видео/статей, которые помогли бы мне выделять структуру в таких диалогах. Пока дальше отдельной кластеризации реплик оператора и реплик клиента не ушел.

источник

12:12пожаловаться #7

David Dale in Natural Language Processing

Для анализа цепочек переходов между состояниями есть целая область знаний, называется process mining. Кажется, можно найти подходящий алгоритм по этой ключевой фразе и скормить ему реплики с метками кластеров.

источник

12:18пожаловаться #8

David Dale in Natural Language Processing

Вот например либа process mining от Сбера: https://habr.com/ru/company/sberbank/blog/565476/

источник

12:19пожаловаться #9

Andrew Valukhov in Natural Language Processing

Здорово, на первый взгляд выглядит как то, что может помочь. Обязательно изучу, спасибо!

источник

12:22пожаловаться #10

S in Natural Language Processing

I don't understand... Please use English

источник

13:33пожаловаться #11

ДС

Дмитрий Симаков... in Natural Language Processing

А фасттекст модельки с rusvectores поддерживаются 4 версией генсима? Я попытался какую-то лежащую у меня открыть, но не вышло - предложили пересохранить версией 3.8+.

источник

14:35пожаловаться #12

David Dale in Natural Language Processing

Не поддерживаются, да, надо более старый генсим ставить.
Лично мне даже пересохранение не помогло (но, возможно, у меня лапы кривые).

источник

14:43пожаловаться #13

ДС

Дмитрий Симаков... in Natural Language Processing

Печаль, спасибо.

источник

14:45пожаловаться #14

El Non in Natural Language Processing

Hi there. What resources do you read on a daily basis to make sure you keep up with the latest ML-related ( and especially NLP-related) news?

источник

14:58пожаловаться #15

S in Natural Language Processing

I saw the hugging face code on anaphora resolution for English language using Spacy parser. But the pipeline for hindi language isn't developed yet for Spacy parser. So I am looking for any API or tool which resolves the anaphora resolution for Hindi language.

источник

15:10пожаловаться #16

Vladimir P in Natural Language Processing

Всем привет. На стажировке дали задачу найти и исправить неправильно распознанные слова из звонков банка, например валенки -> эквайринг. Есть расшифровки звонков с ошибками, а также тексты, полученные из чатов того же банка. Обучил две word2vec модели, первая для звонков и вторая для чата. Могу найти пару слову из звонков.
Вопрос как найти слова, которые нужно исправить?
Сейчас просто считая отдельно, сколько раз какое слово встречается в звонках и чатах, потом ищу слова, которые часто встречаются в звонках и нечасто либо вовсе не встречаются в чатах.

источник

18:02пожаловаться #17

Nikolay V. Shmyrev in Natural Language Processing

В распознавании речи очень редко неизвестное слово заменятся на одно и то же другое знакомое. Замены часто разные. Пар может вообще не найтись.

источник

18:14пожаловаться #18

Nikolay V. Shmyrev in Natural Language Processing

Из чатов можно сделать н-граммную модель, или даже нейросетевую модель. Использовать её для переоценки результатов распознавания, если результатов распознавания несколько. Вес такой модели отладить, чтобы не повышала число ошибок.

источник

18:18пожаловаться #19

Kutuz4 in Natural Language Processing

Товарищи, а как с помощью huggingface делать русскоязычную ner разметку?

источник

18:20пожаловаться #20