Телеграмм чат группы natural_language

Size: a a a

Natural Language Processing

2757 membersпожаловаться на группу

2021 May 22

oldysty in Natural Language Processing

Спасибо большое. А сегодня было что-то интересное?

источник

20:58пожаловаться #1

Yuri Baburov in Natural Language Processing

Сегодня было свободное общение и знакомство со спикерами в секции NLP на 1.5 часа. Много интересного рассказала и поотвечала на вопросы Татьяна Шаврина.

источник

20:59пожаловаться #2

Yuri Baburov in Natural Language Processing

Секция по Interpretable ML тут: https://ods.ai/tracks/interpretable-ml-df2021
Секция NLP in industry тут: https://ods.ai/tracks/nlp-df2021

Все (или те, что уже начались) треки datafest 2021 тут:
https://ods.ai/tracks/groups/data-fest-2021
Если я правильно понял, все завтрашние доклады уже есть в записи, но те, кто придут в онлайн, смогут задать вопросы.

Open Data Science (ODS.ai)

Interpretable & Causal ML — Open Data Science

источник

21:03пожаловаться #3

Aydar Nasyrov in Natural Language Processing

спасибо, с каждым днем узнаю из чатика все больше и больше нового и полезного 😆

источник

22:11пожаловаться #4

Stanislav Petrov in Natural Language Processing

А куда приходить? в комнату в spatial chat?

источник

23:44пожаловаться #5

2021 May 23

Yuri Baburov in Natural Language Processing

Да. В комнату соответствующей секции в spatial chat.

источник

05:52пожаловаться #6

Muhammed Alimbetov in Natural Language Processing

Всем привет.

Как определить ‘какой уровень препроцессинга’ надо произвести для нлп задачи?

Стоит задача sentiment classification, общее количество training дата около 10к, unbalanced, провёл back translation и увеличил количество в два раза.

Пример даты:

До preprocessing
Когда 10 лет назад я принял ее из приюта, она была напугана и агрессивной. Сегодня она самая любящая кошка, я когда-либо встречал.

Провёл все возможные tokenizing, lemma, stemma, stopwords итп и на выходе получил такой текст

После
принять приют напугать агрессивный самый любящий кошка когда-либо встречать.

Допустим если хочу использовать logistic regression, разумно ли делать такой preprocessing или лучше ограничиться минимумом типа удаление English words, возможно немножко stopwords итп.

источник

10:34пожаловаться #7

Stanislav Petrov in Natural Language Processing

Спасибо

источник

12:09пожаловаться #8

Dmitry in Natural Language Processing

Подскажите мануалы как rubert под задачу мультилэйбл классификации приготовить.

источник

13:43пожаловаться #9

SМ

SancheZz Мов in Natural Language Processing

Тф торч?

источник

13:47пожаловаться #10

Dmitry in Natural Language Processing

Торч

источник

13:48пожаловаться #11

Elena in Natural Language Processing

если на входе sparse matrix, то есть смысл уменьшать размер матрицы, например, удалять стоп-слова, делать лемматизацию, ограничивать количество features, выбирая самые значимые, и так далее. Было бы хорошо, если бы вы сами попробовали разные методы препроцессинга и посмотрели, как они влияют на результат.

источник

13:49пожаловаться #12

Kir L in Natural Language Processing

всем привет, а кто в теме Golos от Сбера, это можно как-то без хитростей использовать для распознавания речи, или это просто датасет, и надо свою модель на нем учить? Я что-то не совсем уловил )))

источник

18:53пожаловаться #13

Yuri Baburov in Natural Language Processing

( вообще, тебе в https://t.me/speech_recognition_ru )
1) да, golos -- это датасет, но ещё:
2) они выпустили натренированную модель на Jasper для этого датасета
3) они до конца 2021 года бесплатно дают доступ к своей облачной модели.

Распознавание речи

Распознавание, синтез речи и речевые технологии

источник

19:21пожаловаться #14

Kir L in Natural Language Processing

спасибо!

источник

19:22пожаловаться #15

dePuff in Natural Language Processing

Возможно, такой препроцессинг ухудшит качество сентимент анализа

источник

19:23пожаловаться #16

2021 May 24

Muhammed Alimbetov in Natural Language Processing

А какой вы посоветуете?

источник

01:26пожаловаться #17

Muhammed Alimbetov in Natural Language Processing

Спасибо

источник

01:26пожаловаться #18

Alex Wortega in Natural Language Processing

Всем привет, сижу ковыряю dialog gpt, а как сделать так чтобы на два последовательных одинаковых инпута она по разному отвечала? temperature крутил - не помогает

источник

11:02пожаловаться #19

$○| in Natural Language Processing

Dvar_-_Haya_haya_68342735.mp3

(7.47 Мб)

Простите, не удержался

источник

11:09пожаловаться #20