Телеграмм чат группы theoreticalrl страница 31

"Long-range Robotic Navigation Tasks by Combining Reinforcement Learning and Sampling-based Planning," Faust et al.: (link: https://arxiv.org/abs/1710.03937)

источник

10:04пожаловаться #6

Pavel Shvechikov in RL reading group

Predictive-State Decoders: Encoding the Future into Recurrent Networks (https://arxiv.org/abs/1709.08520) - любопытная статья про улучшение алгортимов, работающих с POMDP средами путем добавления инфомрации необходимой для предсказания будущих состояний в hidden state policy. Кажется (not sure yet), можно пихать в любой алгоритм с рекуррентными сетями и получать profit.

источник

10:53пожаловаться #7

АК

Андрей Квасов... in RL reading group

👍спасибо)

источник

11:24пожаловаться #8

2017 October 14

Pavel Shvechikov in RL reading group

Встречайте новое творение звёздной команды относительно одной из сложнейших проблем RL

Continuous Adaptation via Meta-Learning in Nonstationary and Competitive Environments (https://arxiv.org/pdf/1710.03641)

источник

19:54пожаловаться #9

Oleg Kachan in RL reading group

Rainbow: Combining Improvements in Deep Reinforcement Learning (https://arxiv.org/pdf/1710.02298.pdf)

источник

20:16пожаловаться #10

Aleksey Grinchuk in RL reading group

Revisiting the Arcade Learning Environment: Evaluation Protocols and Open Problems for General Agents (https://arxiv.org/pdf/1709.06009.pdf)

Годный и очень обширный обзор ALE: что смогли сделать за 4 года после выхода фреймворка, чего не смогли, как можно усложнять задачу (добавляя стохастичность), кто какие трюки использовал для лучшего решения задачи, как правильно сравнивать агентов и многое другое.

источник

23:53пожаловаться #11

2017 October 16

Evgenii Zheltonozhsk... in RL reading group

Deep RL Bootcamp Lectures https://sites.google.com/view/deep-rl-bootcamp/lectures

источник

20:59пожаловаться #12

2017 October 17

Aleksey Grinchuk in RL reading group

Тренируют агентов чтоб резать людей

http://bair.berkeley.edu/blog/2017/10/17/lfd-surgical-robots/

The Berkeley Artificial Intelligence Research Blog

Learning Long Duration Sequential Task Structure From Demonstrations with Application in Surgical Robotics

The BAIR Blog

источник

21:07пожаловаться #13

Evgenii Zheltonozhsk... in RL reading group

только хотел закинуть)

источник

21:08пожаловаться #14

Ivan Kush in RL reading group

источник

21:11пожаловаться #15

2017 October 18

Pavel Shvechikov in RL reading group

Ребята, всем добрый вечер!

Завтра, будет два действительно знаментаельных события.
Во-первых, несмотря на то, что distributional RL ускользал от рассмотрения нашей группой дважды, мы все-таки наконец настигли врага “врасплох”, и завтра, верится мне, мы дойдем до самого дна этой работы благодаря усердию и старанию Aleksey!
Во-вторых, наконец-то, спустя почти полгода, как Q-prop появился впервые в наших списках, нашелся герой (Nikita), который принял вызов и завтра расскажет Вам о том, что же такого необычного нашли в работе ревьюеры ICLR2017 и почему соединять off-policy & on-policy learning может быть хорошей идеей.

Если кто еще не успел заполнить заявку на пропуск, пожалуйста сделайте это до конца сегодняшнего дня.

источник

20:16пожаловаться #16

Aleksey Grinchuk in RL reading group

Свежачок:
https://deepmind.com/blog/alphago-zero-learning-scratch/

Deepmind

AlphaGo Zero: Starting from scratch

Artificial intelligence research has made rapid progress in a wide variety of domains from speech recognition and image classification to genomics and drug discovery. In many cases, these are specialist systems that leverage enormous amounts of human expertise and data.However, for some problems this human knowledge may be too expensive, too unreliable or simply unavailable. As a result, a long-standing ambition of AI research is to bypass this step, creating algorithms that achieve superhuman performance in the most challenging domains with no human input. In our most recent paper, published in the journal Nature, we demonstrate a significant step towards this goal.

источник

21:27пожаловаться #17

Evgenii Zheltonozhsk... in RL reading group

Aleksey Grinchuk

Свежачок:
https://deepmind.com/blog/alphago-zero-learning-scratch/

Deepmind

AlphaGo Zero: Starting from scratch

прям хочется чтобы ктото побил классические шахматные движки нейронкой

источник

21:29пожаловаться #18

Artem Grachev in RL reading group

вот это выдержка у ребят — по 40 дней сетки тренировать)

источник

21:50пожаловаться #19

Aleksey Grinchuk in RL reading group

Здорово же! Она себе считается и есть не просит, а вы в это время с корешами статьи пишете на всякие nipsы, icmlи, пока графики для статьи в nature считаются (:

источник

21:59пожаловаться #20