Телеграмм чат группы dlinnlp страница 5

parrot.ru

Рейтинг популярных групп и каналов

В рейтинге участвует:

групп:

каналов:

Виртуальный сервер на SSD - недорого!

Аренда выделенных и виртуальных серверов (VDS/VPS), хостинг, аренда IP-адресов, администрирование, круглосуточная поддержка

qwarta.ru подробнее

Резервное копирование с проверкой на вирусы!!!

Удобный сервис создания резервных копий на любой сервер сети интернет. Отслеживайте изменения, проверяйте на вирусы. Надежно защитите свой бизнес!

go.backupland.com

Выбираете сервер? Любая конфигурация на заказ!

Аренда физических серверов любых конфигураций под любые запросы - 1С бухгалтерия, игровые сервера, нагруженные проекты, интернет-магазины!

qwarta.ru подробнее

Size: a a a

DL in NLP

2929 membersпожаловаться на группу

1
«
…
‹
1
2
3
4
5
6
›
…
»

2018 November 20

Neural Machine Translation by Jointly Learning to Align and Translate
(Dzmitry Bahdanau, Kyunghyun Cho, Yoshua Bengio, 2014)

Оригинальная статья по attention. У вас уже есть весь нужный бэкграунд, чтобы в ней разобраться.

https://arxiv.org/pdf/1409.0473.pdf

источник

102413:21пожаловаться #1

The Annotated Encoder-Decoder with Attention

Отличный блогпост-ноутбук с объяснением attention-механизма, комментариями к статье Bahdanau (предыдущий пост) и кодом.

https://bastings.github.io/annotated_encoder_decoder/?utm_campaign=NLP%20News&utm_medium=email&utm_source=Revue%20newsletter

источник

107413:32пожаловаться #2

Good practices in Modern Tensorflow for NLP

https://roamanalytics.com/2018/09/24/good-practices-in-modern-tensorflow-for-nlp/

источник

100722:32пожаловаться #3

2018 November 22

Напоминаю, что сегодня восьмой семинар. Его проведёт сотрудник нашей лаборатории Алексей Сорокин.
Поговорим про машинный перевод и attention. Attention - очень важная тема и не только в контексте машинного перевода. Так что приходите.

Для тех, кто не может прийти, ссылка на трансляцию: https://www.youtube.com/watch?v=_ypLO27UI1U

DL in NLP seminar 8: Machine Translation with Attention

источник

101115:34пожаловаться #4

2018 November 23

На следующем семинаре мы разберём архитектуру Transformer - новый подход к обработке последовательностей, очень сильно завязанный на attention.

К сожалению, видеолекция Стэнфорда по трансформеру пока недоступна простым смертным, поэтому придётся читать.

Таким образом задание:
1) оригинальная статья: Attention is All You Need (Vaswani et. al, 2017) https://arxiv.org/pdf/1706.03762.pdf
2) квиз будет позже
3) ваши вопросы: https://goo.gl/forms/MxWeBFhhPakjKJ2R2

Обязательно прочитайте статью, архитектура довольно хитрая, но важная. На последнем семинаре будем разбирать три, наверное, самых важных статьи 2018 года и в одной из них transformer будет ключевой частью.

Вопросы к девятому NLP Семинару

Задайте вопросы, которые Вы хотели бы обсудить на ближайшем семинаре.

источник

97101:32пожаловаться #5

И сразу пачка дополнительных материалов:
1) Слайды с лекции Стэнфорда https://web.stanford.edu/class/cs224n/lectures/lecture12.pdf
2) Annotated transformer http://nlp.seas.harvard.edu/2018/04/03/attention.html
3) Illustrated transformer http://jalammar.github.io/illustrated-transformer/
4) Главные достижения в области обработки естественного языка в 2017 году: https://habr.com/company/ods/blog/347524/

jalammar.github.io

The Illustrated Transformer

Discussions:
Hacker News (65 points, 4 comments), Reddit r/MachineLearning (29 points, 3 comments)

Translations: Chinese (Simplified), French, Japanese, Korean, Russian, Spanish

Watch: MIT’s Deep Learning State of the Art lecture referencing this post

In the previous post, we looked at Attention – a ubiquitous method in modern deep learning models. Attention is a concept that helped improve the performance of neural machine translation applications. In this post, we will look at The Transformer – a model that uses attention to boost the speed with which these models can be trained. The Transformers outperforms the Google Neural Machine Translation model in specific tasks. The biggest benefit, however, comes from how The Transformer lends itself to parallelization. It is in fact Google Cloud’s recommendation to use The Transformer as a reference model to use their Cloud TPU offering. So let’s try to break the model apart and look at how it functions.

The Transformer was proposed in the paper Attention is…

источник

102901:35пожаловаться #6

Домашнее задание номер 5:
https://github.com/deepmipt/deep-nlp-seminars/blob/master/seminar_08/attentive_translation.ipynb

Мягкий дедлайн: 30 ноября
Жёсткий дедлайн: 7 декабря

Если у вас мало времени, лучше уделите его на проект - за него можно получить гораздо больше баллов.

deepmipt/deep-nlp-seminars

Materials for deep NLP course. Contribute to deepmipt/deep-nlp-seminars development by creating an account on GitHub.

источник

109210:57пожаловаться #7

По проектам:
Пишите @dropout05, если хотите встретиться на этих/следующих выходных и задать вопросы / помочь вам, если вы застряли. Задавайте любые вопросы, даже в формате "у меня ничего не сходится, что с этим делать?".
Финальная презентация проектов будет 13 декабря. Соответственно, это жёсткий дедлайн.
Мы постараемся организовать кодинг-сессию по проектам в следующую субботу или на выходных через неделю.

источник

114510:58пожаловаться #8

2018 November 29

Всем привет. Сегодня у нас с вами семинар по трансформеру. Тк лекции Стэнфорда по нему нету, то обсудим всё в подробностях. Приходите офлайн, задавайте вопросы.

P.S. Квиза по трансформеру не будет.

источник

95515:28пожаловаться #9

A proposal of good practices for files, folders and models architecture

Рекомендую прочитать всем, кто делает проект, и оформить его так. И рекомендации достаточно общие, так что не важно, деаете вы проект на tf/pytorch/etc.

https://blog.metaflow.fr/tensorflow-a-proposal-of-good-practices-for-files-folders-and-models-architecture-f23171501ae3

TensorFlow: A proposal of good practices for files, folders and models architecture

Designing the right file architecture is not straightforward in Machine Learning. After struggling on that question for a few projects of…

источник

103717:15пожаловаться #10

Ссылка на трансляцию:
https://youtu.be/KMgJFptbNlM

Сегодня начнём трансляцию минут на 5-10 пораньше, чтобы отладить возможные проблемы со звуком. Если кто-то поможет с фидбеком, будет очень классно.

DL in NLP seminar 9: Attention Is All You Need. Transformer networks.

источник

110017:34пожаловаться #11

2018 November 30

Attention is all you need. Transformer.pdf

Слайды с предыдущего семинара

источник

103617:14пожаловаться #12

"2018 is the year of transfer learning in NLP". Следовательно, на следующем семинаре будем обсуждать вот эти три статьи:

Deep contextualized word representations [Peters et al., 2018] https://arxiv.org/pdf/1802.05365.pdf
Universal Language Model Fine-tuning for Text Classification [Howard and Ruder, 2018] https://arxiv.org/pdf/1801.06146.pdf
BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding [Devlin et al., 2018] https://arxiv.org/abs/1810.04805

Они проще Attention is All You Need, но за один семинар так же подробно мы их разобрать не успеем. Так что очень советую прочитать их дома, у вас уже есть весь необходимый бэкграунд.

Квиз может быть будет, а может быть и нет.

источник

114017:19пожаловаться #13

2018 December 02

Статья от авторов статьи ULMfit

http://nlp.fast.ai/classification/2018/05/15/introducting-ulmfit.html

А также пара видео, которые могут помочь лучше разобраться в подходе:
https://youtu.be/gbceqO8PpBg?t=1h23m30s
https://youtu.be/h5Tz7gZT9Fo?t=16m40s

Lesson 4: Deep Learning 2018

NB: Please go to http://course.fast.ai to view this video since there is important updated information there. If you have questions, use the forums at http://forums.fast.ai

We complete our work from the previous lesson on tabular/structured, time-series data, and learn about how to avoid overfitting by using dropout regularization. We then introduce natural language processing with recurrent neural networks, and start work on a language model.

источник

111115:49пожаловаться #14

2018 December 03

Open Sourcing BERT: State-of-the-Art Pre-training for Natural Language Processing

Статья гугла про релиз кода BERT. В конце есть ссылка, чтобы поиграться с ним в colab.

https://ai.googleblog.com/2018/11/open-sourcing-bert-state-of-art-pre.html
https://colab.sandbox.google.com/github/tensorflow/tpu/blob/master/tools/colab/bert_finetuning_with_cloud_tpus.ipynb

Open Sourcing BERT: State-of-the-Art Pre-training for Natural Language Processing

Posted by Jacob Devlin and Ming-Wei Chang, Research Scientists, Google AI Language One of the biggest challenges in natural language proce...

источник

108511:01пожаловаться #15

BERT Explained: State of the art language model for NLP

А теперь более содержательная статья

https://towardsdatascience.com/bert-explained-state-of-the-art-language-model-for-nlp-f8b21a9b6270

BERT Explained: State of the art language model for NLP

An approachable and understandable explanation of BERT, a recent paper by Google that achieved SOTA results in wide variety of NLP tasks.

источник

119311:05пожаловаться #16

2018 December 04

The Illustrated BERT, ELMo, and co. (How NLP Cracked Transfer Learning)

Только вчера вышла статья от автора Illustrated Transformer. Обязательно прочитайте перед семинаром.

https://jalammar.github.io/illustrated-bert/

jalammar.github.io

The Illustrated BERT, ELMo, and co. (How NLP Cracked Transfer Learning)

Discussions:
Hacker News (98 points, 19 comments), Reddit r/MachineLearning (164 points, 20 comments)

Translations: Chinese (Simplified), French, Japanese, Korean, Persian, Russian

The year 2018 has been an inflection point for machine learning models handling text (or more accurately, Natural Language Processing or NLP for short). Our conceptual understanding of how best to represent words and sentences in a way that best captures underlying meanings and relationships is rapidly evolving. Moreover, the NLP community has been putting forward incredibly powerful components that you can freely download and use in your own models and pipelines (It’s been referred to as NLP’s ImageNet moment, referencing how years ago similar developments accelerated the development of machine learning in Computer Vision tasks).

источник

121116:17пожаловаться #17

Вы ждали этого, вы боялись этого, но этот момент настал.

Табличка с рейтингом: https://docs.google.com/spreadsheets/d/1qpzSVHdIWeZRfIYcbaRmC-vhWev-krJiWG8PQsAxoQU/edit#gid=0

Работы всё ещё проверяются, но если у вас не проверено ни одной (и при этом сделано больше одной), пишите nlp_course@ipavlov.ai

main

Surname,Name,Middle name,Quiz 1,Quiz 2,Quiz 3,Quiz 4,Quiz 5,Quiz 6,Quiz 7,Quiz 8,Assignment 1,Assignment 2,Assignment 3,Assignment 4,Assignment 5,Total,Email hash
Остроухов,Петр,Алексеевич,5,3,4,4,5,4,4,5,10,7,8,6,10,5,7,50,125,3,8d430f0126399382df26e69288eb8323
Сафин,Камиль,5,5,5,5,4,5,5,9...

источник

129316:34пожаловаться #18

2018 December 06

Тут на NeurIPS, проходящей сейчас в Монреале, отличное выступление насчёт unsupervised learning. И про NLP тоже есть.

https://www.facebook.com/nipsfoundation/posts/795861577420073/

Neural Information Processing Systems

Welcome Back to the NeurIPS 2018 Tutorial Sessions. This tutorial Unsupervised Deep Learning will cover in detail, the approach to simply 'predict everything' in the data, typically with a...

источник

125410:10пожаловаться #19

Приходите на семинар, сегодня обсуждаем три самых главных статьи по NLP 2018 года

Ссылка на трансляцию будет позже

источник

122617:02пожаловаться #20

1
«
…
‹
1
2
3
4
5
6
›
…
»