Телеграмм чат группы dlinnlp страница 15

10148907792880119076.wav

(284.82 Кб)

Baseline cascade translation - обычный подход: распознавание речи -> перевод -> генерация речи

130523:48пожаловаться #1

10148907792880119076-2.wav

(256.31 Кб)

Translatotron translation (original speaker’s voice)

По непонятной причине я не могу прослушать последние записи в телеграм, но надеюсь, что вы можете.

143323:50пожаловаться #2

2019 May 17

Всем привет!
Если у вас проверены не все задачи и вы хотите это исправить - заполните, пожалуйста, форму.

https://forms.gle/CQUXxggB35QmKBJs6

Поздравляем! Вы дошли до конца курса.

Скорее всего, из-за багов бота, у вас на данный момент не проверены все задания. Для того, чтобы исправить это, давайте соберём список тех людей, которые ещё активны и хотят проставить себе баллы за задачи. После этого всем людям из этого кластера будут разданы проверки в боте.

Проверка заданий

164411:03пожаловаться #3

2019 May 19

Пачка интересных (мне) статей (вам) на выходные:

A La Carte Embedding: Cheap but Effective Induction of Semantic Feature Vectors, Khodak et al. [Princeton], 2018
Почти бесплатный способ получать эмбеддинги для OOV-слов из ваших готовых классических эмбеддингов

Cross-lingual Language Model Pretraining, Lample & Conneau [FAIR], 2019
BERT для машинного перевода и другие штуки. Как-то пропустил эту статью, нужно было бы обсудить её на семинаре про unsupervised машинный перевод.

How to Fine-Tune BERT for Text Classification?, Sun et al. [Fudan University], 2019
Название говорит само за себя.

Training Tips for the Transformer Model, Popel & Bojar [Charles University], 2018
Большая статья о том, как правильно варить трансформеры. Я бы не верил им во всех пунктах, по-моему местами там было что-то спорное, но исследование очень полезное.

136013:18пожаловаться #4

И вот очень красивый код: весь трансформер в 40 строк на PyTorch 1.1

by 🤗

221213:20пожаловаться #5

dlinnlp

Всем привет!
Если у вас проверены не все задачи и вы хотите это исправить - заполните, пожалуйста, форму.

https://forms.gle/CQUXxggB35QmKBJs6

Поздравляем! Вы дошли до конца курса.

Скорее всего, из-за багов бота, у вас на данный момент не проверены все задания. Для того, чтобы исправить это, давайте соберём список тех людей, которые ещё активны и хотят проставить себе баллы за задачи. После этого всем людям из этого кластера будут разданы проверки в боте.

Проверка заданий

Закрываю форму в течение часа. Если кто-то не успеет, будет нехорошо.

150113:34пожаловаться #6

2019 May 20

Всем привет!
В этот четверг у нас будет занятие с приглашёнными лекторами из iPavlov
Расскажем вам про наши исследования и задачи.
Время и место стандартные.

122117:47пожаловаться #7

Pre-training BERT from scratch with cloud TPU

Если кто-то хочет разобраться с Cloud TPU + BERT, то вот хороший пост на Medium
https://towardsdatascience.com/pre-training-bert-from-scratch-with-cloud-tpu-6e2f71028379?sk=51c46354668b0fc4255fe8bb7e1e3035

Towards Data Science

In this experiment, we will be pre-training a state-of-the-art Natural Language Understanding model BERT on arbtrary text data using…

162419:32пожаловаться #8

2019 May 21

В этот четверг будет два спикера. Мария Трофимова расскажет вам о применении BERT к прикладным задачам. В том числе она будет опираться на последние исследования нашей лаборатории.

Adaptation of Deep Bidirectional Multilingual Transformers for Russian Language
Kuratov & Arkhipov [iPavlov], 2019
arxiv.org/abs/1905.07213

133211:29пожаловаться #9

И напоминаю, что в эту субботу у нас постер-сессия.
Ориентировочно, она будет длиться 2 часа, давайте узнаем, когда спикерам удобнее всего и оценим количество человек. По внутренним причинам, начать раньше 14 не можем. Точное время будет объявлено позже.

https://forms.gle/AanpoFTkYFDetfoq6

В эту субботу (25.05.19) будет проходить постер-сессия. Её посещение __обязательно__ для тех, кто хочет получить баллы за финальный проект.

Те, кто не физически не могут посетить постер-сессию (живут в другом городе etc.), могут предоставить короткое видео (до 10 минут) с презентацией вашего проекта. Ссылку на видео нужно будет выслать до 12:00 25.05.19 на nlp_course@ipavlov.ai с темой Poster Session Presentation

Постер-сессия будет идти ориентировочно 2 часа, но вообще столько, сколько понадобится.

Изначально планировалось, что постер-сессия будет открыта только для участников курса. Если это не ваш случай, пишите @dropout05. Каждый случай рассматривается отдельно.

Poster session

145213:31пожаловаться #10

2019 May 22

dlinnlp

И напоминаю, что в эту субботу у нас постер-сессия.
Ориентировочно, она будет длиться 2 часа, давайте узнаем, когда спикерам удобнее всего и оценим количество человек. По внутренним причинам, начать раньше 14 не можем. Точное время будет объявлено позже.

https://forms.gle/AanpoFTkYFDetfoq6

В эту субботу (25.05.19) будет проходить постер-сессия. Её посещение __обязательно__ для тех, кто хочет получить баллы за финальный проект.

Те, кто не физически не могут посетить постер-сессию (живут в другом городе etc.), могут предоставить короткое видео (до 10 минут) с презентацией вашего проекта. Ссылку на видео нужно будет выслать до 12:00 25.05.19 на nlp_course@ipavlov.ai с темой Poster Session Presentation

Постер-сессия будет идти ориентировочно 2 часа, но вообще столько, сколько понадобится.

Изначально планировалось, что постер-сессия будет открыта только для участников курса. Если это не ваш случай, пишите @dropout05. Каждый случай рассматривается отдельно.

Poster session

Всем привет.
Тем, кто не очень знаком с форматом постер-сессии, вот несколько очевидных советов о том, как сделать ваш постер чуть лучше
https://www.youtube.com/watch?v=AwMFhyH7_5g

И если вы ещё не заполнили форму, пожалуйста, сделайте это https://forms.gle/AanpoFTkYFDetfoq6

YouTube

Making a better research poster

8 tips for creating a great research poster for a conference, from the Poster Illustration team at AJE. Visit our Author Resource Center for publishing tips:...

119615:31пожаловаться #11

те, кто хочет, чтобы их постеры распечатали - отправьте мне их до утра пятницы
(обязательно PDF)
почти наверное мы сможем это сделать

если это окажется не так - сразу же предупредим вас

117616:05пожаловаться #12

Amazon pet product reviews classification

Призыв от Юры Кашницкого тем, кто интересуется приложениями transfer learning NLP к практическим задачам:

Для кого transfer learning особенно актуален - подключайтесь к моей небольшой рисеч-группке. Цель - заставить это овсе работать на практике или хотя бы выработать best practices, скажем, как файнтюнить BERT для классификации (поможет и на кэггле в будущем). Пока я организовал два инкласс-соревнования. Идея - делиться кодом и идеями, как можно больше обсуждать.

https://www.kaggle.com/c/amazon-pet-product-reviews-classification
https://www.kaggle.com/c/clickbait-news-detection

У нас есть канал в слэке. Сейчас я пересматриваю формат сотрудничества, т.к. слегка заглохло, все свое пилят 🙂 Если заинтересованы - напишите мне в личку.

Kaggle

Explore semi-supervised and transfer learning for NLP

150518:02пожаловаться #13

2019 May 23

Напоминаю, что сегдоня у нас лекция от iPavlov!
Второй лектор - Алексей Сорокин - расскажет вам про задачи, похожие на перевод, в которых плохо работает стандартный механизм внимания, прежде всего автоматическое словоизменение. Чтобы примерно понять, что это такое, можно посмотреть статью

Morphological Inflection Generation with Hard Monotonic Attention, Aharoni & Goldberg, 2017
https://arxiv.org/pdf/1611.01487.pdf

121711:06пожаловаться #14

Course "Theories of Deep Learning". Contribute to deepmipt/tdl development by creating an account on GitHub.

И третий лектор - Евгений Голиков. Кто-то из вас уже может знать Женю, тк он ведёт курс по теориям глубокого обучения в нашей лабе https://github.com/deepmipt/tdl
Женя расскажет про вторую итерацию курса, которая начнётся в следующем семестре. Обязательно будет интересно.

GitHub

deepmipt/tdl

183113:21пожаловаться #15

Через 20 минут у нас занятие с лекторами из iPavlov. Приходите!

118118:37пожаловаться #16

Сорян, печати постеров не будет 😕

118320:19пожаловаться #17

Постеры должны быть формата А0.
Пример (не самый хороший) есть тут: clck.ru/GA6b3
В качестве Tex-шаблона можете использовать вот эти: clck.ru/GA6c7

Рекомендации по постерам и видео от Стенфорда: clck.ru/GA6f9

В качестве хороших примеров предлагаю смотреть на постеры cs224n: clck.ru/GA6qy

1 Neural Systems and Deep Learning Laboratory Moscow Institute of Physics and Technology Структурный анализ траектории движений глаз человека Case Study Base model Named Entity Recognition (NER) task is an important part for conversational AI. A typical user of a conversation system has no time t...

NER in noisy domains

128920:59пожаловаться #18

2019 May 24

Пожалуйста, все, кто ещё не был на наших офлайн занятиях, но будет на постер-сессии - отправьте мне своё ФИО в течение 1-2 часов, уже надо подавать списки

121612:01пожаловаться #19

104: How to Give a Perfect Poster Presentation - Hello PhD

Выпуск очень достойного подкаста про всякие PhD-штуки, конкретно этот про то, как достойно выступить на постер-сессии.

Для всех, кто готовится к завтрашней презентации будет полезно.

http://hellophd.com/2018/11/104-how-to-give-a-perfect-poster-presentation/

Hello PhD

Let's face it, most poster sessions are filled with text-heavy layouts and dull, lifeless presenters. Here are the steps to make your poster presentation shine!