Телеграмм чат группы dlinnlp страница 31

parrot.ru

Рейтинг популярных групп и каналов

В рейтинге участвует:

групп:

каналов:

Виртуальный сервер на SSD - недорого!

Аренда выделенных и виртуальных серверов (VDS/VPS), хостинг, аренда IP-адресов, администрирование, круглосуточная поддержка

qwarta.ru подробнее

Резервное копирование с проверкой на вирусы!!!

Удобный сервис создания резервных копий на любой сервер сети интернет. Отслеживайте изменения, проверяйте на вирусы. Надежно защитите свой бизнес!

go.backupland.com

Выбираете сервер? Любая конфигурация на заказ!

Аренда физических серверов любых конфигураций под любые запросы - 1С бухгалтерия, игровые сервера, нагруженные проекты, интернет-магазины!

qwarta.ru подробнее

Size: a a a

DL in NLP

2929 membersпожаловаться на группу

1
«
…
‹
26
27
28
29
30
31
32
›
…
»

2019 November 10

Переслано от Valentin Malykh

уважаемые коллеги, мы приглашаем вас на следующий семинар, который пройдет в корпусе ВШЭ на Покровском бульваре 16 ноября, в субботу в 15:00; выступать будут: Михаил Галкин расскажет то, что не смог рассказать про knowledge graphs на AI Journey, Дмитрий Пузырев расскажет про векторные представления Пуанкаре и Андрей Бут поделится свежими впечатлениями от поездки на EMNLP
https://sites.google.com/view/huawei-hse-nlp-seminar
ВНИМАНИЕ: чтобы пройти в корпус ВШЭ, нужно зарегистрироваться по ссылке https://forms.gle/mJqZ97w79Spbw6Qz8
ну и вишенка на торте 🍰: мы выложили видео с прошлого семинара! https://www.youtube.com/channel/UCN_Um4u-7F_DkNt2N1824UQ/ как это принято, “лайк, подписка и колокольчик”

Huawei & HSE

Open seminar for recent advances in Speech & NLP. Free to everybody
Organised by Huawei Noah's Ark Lab and Computational Pragmatics Lab HSE

источник

257621:53пожаловаться #1

2019 November 12

Word Embedding Algorithms as Generalized Low Rank Models and their Canonical Form
Kian Kenyon-Dean, [McGill University]
arxiv.org/abs/1911.02639

Более 70 страниц исследования word embeddings, плюс новый способ их тренировать. Предлагаю использовать как справочник, если вы хотите узнать про векторные представления слов подробнее.

Word Embedding Algorithms as Generalized Low Rank Models and their...

Word embedding algorithms produce very reliable feature representations of
words that are used by neural network models across a constantly growing
multitude of NLP tasks. As such, it is...

источник

199810:11пожаловаться #2

2019 November 15

Release Strategies and the Social Impacts of Language Models
Solaiman et al. [OpenAI]
arxiv.org/abs/1908.09203

Философский трактат от OpenAI о различных social impacts, о том, как правильнее релизить большие модели, защите от fake news с аппендиксом про bias and fairness.
На самом деле довольно уникальная работа, советую взглянуть.

источник

140019:22пожаловаться #3

2019 November 17

Подкаст про современный NLP от AI2 - института, который подарил нам AllenNLP, ELMo и много других интересных статей.

podcasts.apple.com/us/podcast/nlp-highlights/id1235937471

За ссылку спасибо @y_emelianov

‎NLP Highlights on Apple Podcasts

‎Science · 2020

источник

139510:11пожаловаться #4

Немножко ссылок, которые я планировал описать в канале за последнюю неделю, но руки так и не дошли

источник

109010:59пожаловаться #5

https://twitter.com/seb_ruder/status/1192189950730608642

Sebastian Ruder

New blog post: Unsupervised cross-lingual representation learning An overview of learning cross-lingual representations without supervision, from the word level to deep multilingual models. Based on our ACL 2019 tutorial. https://t.co/z0kktVNu8m

источник

112810:59пожаловаться #6

https://twitter.com/alex_conneau/status/1192490719031656448

Alexis Conneau

Our new paper: Unsupervised Cross-lingual Representation Learning at Scale https://t.co/N5nTKhUBnE We release XLM-R, a Transformer MLM trained in 100 langs on 2.5 TB of text data. Double digit gains on XLU benchmarks + strong per-language performance (~XLNet on GLUE). [1/6]

источник

112210:59пожаловаться #7

https://twitter.com/svlevine/status/1191411832075898880

Sergey Levine

Embeddings enable fun arithmetic on semantic concepts (e.g., "King-Man+Woman=Queen" for word2vec). Can the same be done with embeddings of *plans*? Compositional plan vectors (CPVs) allow composing tasks by adding their embeddings! https://t.co/NtO5yld7eL https://t.co/mvAwFWJhBs

источник

116210:59пожаловаться #8

https://twitter.com/EzraWu/status/1191898513027796992

Excited to share my summer intern project @facebookai “Emerging Cross-lingual Structure in Pretrained Language Models” https://t.co/YGFhT3Go1e We dissect mBERT & XLM and show monolingual BERTs are similar Joint work with @alex_conneau @AimeeLiS @LukeZettlemoyer @vesko_st

источник

129810:59пожаловаться #9

Переслано от Anya Bataeva

Compressive Transformer for long-range sequence learning
https://twitter.com/Thom_Wolf/status/1195662118974083073

Thomas Wolf

Interesting work (and a nice large and clean dataset as well, looking forward to see it released): "Compressive Transformers for Long-Range Sequence Modelling" by Jack W. Rae, Anna Potapenko, Siddhant M. Jayakumar, Timothy P. Lillicrap (at DeepMind) Paper: https://t.co/CV3ThAAweg

источник

158211:00пожаловаться #10

2019 November 19

twitter.com/thesofakillers/status/1196410719006285826

Giulio Starace

I made a chrome extension that tells you the likelihood that the selected text was generated by an AI. Have a look everyone! github repo link: https://t.co/iIVoXvCa00 chrome web store link: https://t.co/76fv2LNm32 https://t.co/F8quNMK7Cf

источник

117811:26пожаловаться #11

Fresh Ruder Newsletter!

источник

112817:39пожаловаться #12

Переслано от b b

http://newsletter.ruder.io/issues/highlights-of-emnlp-2019-ethics-in-nlp-vol-2-ai-and-journalism-206147

newsletter.ruder.io

Highlights of EMNLP 2019, Ethics in NLP vol. 2, AI and Journalism

Hi all,The themes of this newsletter are highlights from EMNLP 2019, ethical uses of NLP, and AI and journalism. At EMNLP 2019, BERT and multilingual models showed a strong presence, while there were also some dubious use cases for NLP. One particularly challenging domain for AI is news.In addition, we have a treasure trove of high-quality talks from three recent ML and NLP summer schools (Deep Learning Indaba, Khipu, AthensNLP), a lot of resources including paper summaries and lecture slides, a

источник

116817:39пожаловаться #13

Отличная презентация с последнего EMNLP

A SOTA-less, novelty-less journey into neural sequence models

TL;DR
Когда появился нейронный машинный перевод он не был SOTA, его улучшения в своё время не были новыми идеями. Но сейчас это де-факто стандарт в рисёче и проде.
Сейчас происходит много примеров неавторегрессионной генерации текста, но они не SOTA и их улучшения не новые идеи.

Очень советую почитать презентацию, там куда больше интересного, чем может поместиться в TL;DR.

https://drive.google.com/file/d/1HGzv6n9hAj-GL63POUZCO6nCrIHF9y35/view

источник

117421:00пожаловаться #14

Evaluating Combinatorial Generalization in Variational Autoencoders
Bozkurt, Esmaeili, et al. Northeastern University
arxiv.org/abs/1911.04594

The paper studies how well shallow and deep VAEs are able to generalize in different dataset split settings. They try two different dataset split techniques: “easy” and “hard” generalization problem and change dataset size “small dataset” vs. “big dataset.”

VAEs are trained to autoencode MNIST images.

First, they study how well VAE memorizes the training set. Deep models memorize it more then shallow and reuse memorized examples to extrapolate to reconstruct unseen data. Particularly, they find that the reconstructions of unseen data (e.g., some class in MNIST that was absent during training) are closer to training examples in a deep model.

Their study is consistent with the work of Belkin et al. 2018 in the case of “easy” generalization - deep models generalize better with increased capacity. But in the case of “hard” generalization, deeper models perform worse as the capacity increases.

Also, they found that increasing data amount helps deep models to generalize much more than it helps shallow.

I think this is the first paper in a long time with both MNIST and exciting findings.

источник

126021:47пожаловаться #15

источник

123721:47пожаловаться #16

источник

140621:47пожаловаться #17

Evaluating_highlighted.pdf

источник

191521:47пожаловаться #18

2019 November 20

Когда НЛП встречается с МММ.
Потому что мы удачливы на аббревиатуры.

arxiv.org/abs/1910.00458

MMM: Multi-stage Multi-task Learning for Multi-choice Reading Comprehension

Machine Reading Comprehension (MRC) for question answering (QA), which aims
to answer a question given the relevant context passages, is an important way
to test the ability of intelligence...

источник

179710:40пожаловаться #19

2019 November 22

Energy-Based Self-Supervised Learning
Yan LeCun

Так как поток интересных NLP-статей как-то затих, держите ещё одну презентацию. Слайды с очень крутой лекции ЛеКуна о предобучении и моделях с латентными переменными. Был на такой же его лекции в Гарварде, было интересно.

https://drive.google.com/file/d/1NCLbdkIDaU1ZvZ3dp7xi7CGhxKRgWChw/view

lecun-20191119-ipam.pdf

источник

181111:26пожаловаться #20

1
«
…
‹
26
27
28
29
30
31
32
›
…
»