Телеграмм чат группы dlinnlp страница 28

Size: a a a

DL in NLP

2019 October 22

Другие ссылки, которые меня зацепили:

Slice-based learning
PhD 101
Gaussian Process, not quite for dummies
The Duolingo CEFR Checker: An AI Tool for Adapting Learning Content
Tips on how to write a great science paper

www.snorkel.org

Slice-based Learning

We introduce a programming model for improving performance on application-critical data subsets, or slices.

источник

127916:53пожаловаться #1

DL in NLP

источник

142416:53пожаловаться #2

2019 October 23

DL in NLP

Переслано от Boris Zubarev

из твиттера рудера:

Most of the world’s text is not in English. We are releasing MultiFiT to train and fine-tune language models efficiently in any language.

Post: http://nlp.fast.ai/classification/2019/09/10/multifit.html
Paper: https://arxiv.org/abs/1909.04761

Abstract
Pretrained language models are promising particularly for low-resource languages as they only require unlabelled data. However, training existing models requires huge amounts of compute, while pretrained cross-lingual models often underperform on low-resource languages. We propose Multi lingual language model Fine-Tuning (MultiFiT) to enable practitioners to train and fine-tune language models efficiently in their own language. In addition, we propose a zero-shot method using an existing pretrained cross-lingual model. We evaluate our methods on two widely used cross-lingual classification datasets where they outperform models pretrained on orders of magnitude more data and compute. We release all models and code.

источник

121117:05пожаловаться #3

DL in NLP

Переслано от Boris Zubarev

источник

118017:05пожаловаться #4

DL in NLP

Хорошая статья от Skynet Today про последнее громкое достижение OpenAI - роборука, умеющая манипулировать кубиком Рубика и хайп вокруг этого.

TL;DR
OpenAI делает очень крутые вещи, но их маркетинг зачастую искривляет их достижения. Хайп возникает вместе с недопониманием результатов и OpenAI на это никак не реагирует.

От себя хочу добавить, что маркетинг OpenAI и правда странный, хоть и эффективный. К примеру статья про GPT-2 была совсем не про генерацию реалистичного текста, однако даже большинство исследователей не знают об этом.

skynettoday.com/briefs/openai-rubiks-cube

Skynet Today

OpenAI's Dexterous Robotic Hand — Separating Progress from PR

The Rubik’s cube solving hand is representative of a true research contribution, but its many caveats do not merit the PR hype

источник

152218:06пожаловаться #5

2019 October 24

DL in NLP

https://twitter.com/colinraffel/status/1187161460033458177

C4 и T5

За твитом большой тред с саммари статьи. Выглядит интересно.

Twitter

Colin Raffel

New paper! We perform a systematic study of transfer learning for NLP using a unified text-to-text model, then push the limits to achieve SoTA on GLUE, SuperGLUE, CNN/DM, and SQuAD. Paper: https://t.co/UJKhZJkffv Code/models/data/etc: https://t.co/IiktjHrrxM Summary ⬇️ (1/14)

источник

142820:20пожаловаться #6

2019 October 25

DL in NLP

BERT теперь есть в основном продукте гугла - поиске.

Очень крутая новость. Год назад, когда статья только-только вышла, я был уверен, что это слишком тяжёлая модель для прода. Однако вот как оно вышло.

Интересно, как они решили проблемы ранжирования с помощью берта:
1. Получение качественного хэша <— дообучение CLS-токена с помощью tiplet loss?
1. Обновление хэша всего интернета при обновлении модели <— ??

источник

121620:58пожаловаться #7

DL in NLP

Переслано от b b

https://www.blog.google/products/search/search-language-understanding-bert/

BERT теперь используют в гугле в поиске.

Google

Understanding searches better than ever before

How new advances in the science of language understanding will help you find more useful information in Search.

источник

201220:58пожаловаться #8

DL in NLP

Открою немного внутренних презентаций нашей лабы в мир.

Две отличных презентации от @guacamolia про интерпретацию и анализ BERT и вообще transfer learning в NLP. Более 10 статей!

Раз, два

Google Docs

BERT EMNLP 2019

Findings on BERT EMNLP-2019 + arXiv

источник

121821:12пожаловаться #9

DL in NLP

источник

121521:12пожаловаться #10

2019 October 26

DL in NLP

Переслано от Mikhail Burtsev

Интересная статья по супер перспективному направлению комбинации языковых моделей и графов знаний. Рассматривается задача суммаризации, например, на вход подаётся топ 100 документов поисковой выдачи, а на выходе генерируется аннотация длиной 150 токенов.

Задача решается в два этапа. Сначала, из выдачи выделяются триплеты - (субъект, предикат, объект), которые объединяют в общий граф с сущностями вершинами и предикатами ребрами. Полученный граф лианиризуется - представляется в виде строки.

На втором этапе, запрос и лианиризованное представление графа по отдельности кодируются трансформером. Результаты прогоняются через иерархический аттеншн. Векторное представление после аттеншна используется seq2seq трансформером для генерации ответа.

Важной частью обучения модели является multi-task trainig. Система тренируется не только для суммаризации, но и для восстановления графа знаний (по принципу маскирования при обучении языковых моделей). Подобный подход можно использовать и для совместной тренировки знание-языковой модели.

PS: мы в iPavlov как раз сейчас ищем людей, кто может или чувствует себя готовым делать подобные штуки для Q&A пишите мне @MBurtsev

https://research.fb.com/publications/using-local-knowledge-graph-construction-to-scale-seq2seq-models-to-multi-document-inputs/

Facebook Research

Using Local Knowledge Graph Construction to Scale Seq2Seq Models to Multi-Document Inputs - Facebook Research

Query-based open-domain NLP tasks require information synthesis from long and diverse web results. Current approaches extractively select portions of web text as input to Sequence-to-Sequence models using methods such as TF-IDF ranking. We propose constructing a local graph structured knowledge base for each query, which compresses the web search information and reduces redundancy.

источник

160711:50пожаловаться #11

DL in NLP

Переслано от Mikhail Burtsev

источник

145611:50пожаловаться #12

DL in NLP

Переслано от Mikhail Burtsev

источник

152211:50пожаловаться #13

2019 October 27

DL in NLP

We have released code for computing Convolutional Neural Tangent Kernel (CNTK) used in our paper "On Exact Computation with an Infinitely Wide Neural Net", which will appear in NeurIPS 2019.
Paper: https://arxiv.org/abs/1904.11955
Code: https://github.com/ruosongwang/CNTK

Via twitter.com/RuosongW/status/1188107700342788096

источник

131418:38пожаловаться #14

DL in NLP

источник

165220:19пожаловаться #15

DL in NLP

So true...

источник

162720:19пожаловаться #16

2019 October 29

DL in NLP

Переслано от viktor

https://twitter.com/artetxem/status/1188788015969255425?s=20

Twitter

Mikel Artetxe

Check out our new paper "On the Cross-lingual Transferability of Monolingual Representations" (w/ @seb_ruder & @DaniYogatama) We challenge common beliefs of why mBERT works by showing that a monolingual BERT can also be transferred to new languages https://t.co/gHtgxxmlWY

источник

128423:19пожаловаться #17

2019 October 30

DL in NLP

Sesame Street hash function collision

ERNIE by Baidu
ERNIE by Tsinghua University and Huawei

It’s funny that both papers are about knowledge graph integration to transformer pre-training and both from Chinese research groups.

источник

140209:19пожаловаться #18

DL in NLP

Free GPUs with a standard Jupyter Interface (bye colab!)

источник

123122:02пожаловаться #19

DL in NLP

https://blog.paperspace.com/paperspace-launches-gradient-community-notebooks/

Paperspace Blog

Free GPUs for Machine Learning and Deep Learning | Paperspace Gradient

Gradient Community Notebooks provide free GPUs with pre-configured environments for machine learning and deep learning projects.

источник

157922:02пожаловаться #20