Size: a a a

RL reading group

2017 October 12

AP

Anton Pechenko in RL reading group
источник

AP

Anton Pechenko in RL reading group
трасляция
источник

AP

Anton Pechenko in RL reading group
Напишите, работает ли, есть звук?
источник

АС

Артём С in RL reading group
Работает, звук есть
источник

LV

Liza Vakhrameeva in RL reading group
источник
2017 October 13

P

Pavel Shvechikov in RL reading group
"Long-range Robotic Navigation Tasks by Combining Reinforcement Learning and Sampling-based Planning," Faust et al.: (link: https://arxiv.org/abs/1710.03937)
источник

P

Pavel Shvechikov in RL reading group
Predictive-State Decoders: Encoding the Future into Recurrent Networks  (https://arxiv.org/abs/1709.08520)  - любопытная статья про улучшение алгортимов, работающих с POMDP средами путем добавления инфомрации необходимой для предсказания будущих состояний в hidden state policy. Кажется (not sure yet), можно пихать в любой алгоритм с рекуррентными сетями и получать profit.
источник

АК

Андрей Квасов... in RL reading group
👍спасибо)
источник
2017 October 14

P

Pavel Shvechikov in RL reading group
Встречайте новое творение звёздной команды относительно одной из сложнейших проблем RL

Continuous Adaptation via Meta-Learning in Nonstationary and Competitive Environments (https://arxiv.org/pdf/1710.03641)
источник

OK

Oleg Kachan in RL reading group
Rainbow: Combining Improvements in Deep Reinforcement Learning (https://arxiv.org/pdf/1710.02298.pdf)
источник

AG

Aleksey Grinchuk in RL reading group
Revisiting the Arcade Learning Environment: Evaluation Protocols and Open Problems for General Agents (https://arxiv.org/pdf/1709.06009.pdf)

Годный и очень обширный обзор ALE: что смогли сделать за 4 года после выхода фреймворка, чего не смогли, как можно усложнять задачу (добавляя стохастичность), кто какие трюки использовал для лучшего решения задачи, как правильно сравнивать агентов и многое другое.
источник
2017 October 16

EZ

Evgenii Zheltonozhsk... in RL reading group
источник
2017 October 17

AG

Aleksey Grinchuk in RL reading group
Тренируют агентов чтоб резать людей

http://bair.berkeley.edu/blog/2017/10/17/lfd-surgical-robots/
источник

EZ

Evgenii Zheltonozhsk... in RL reading group
только хотел закинуть)
источник

IK

Ivan Kush in RL reading group
источник
2017 October 18

P

Pavel Shvechikov in RL reading group
Ребята, всем добрый вечер!

Завтра,  будет два действительно знаментаельных события.
Во-первых, несмотря на то, что  distributional RL ускользал от рассмотрения нашей группой дважды, мы все-таки наконец настигли врага “врасплох”, и завтра, верится мне, мы дойдем до самого дна этой работы благодаря усердию и старанию Aleksey!  
Во-вторых, наконец-то, спустя почти полгода, как Q-prop появился впервые в наших списках, нашелся герой (Nikita), который принял вызов и завтра расскажет Вам о том, что же такого необычного нашли в работе ревьюеры ICLR2017 и почему соединять off-policy & on-policy learning может быть хорошей идеей.

Если кто еще не успел заполнить заявку на пропуск, пожалуйста сделайте это до конца сегодняшнего дня.
источник

AG

Aleksey Grinchuk in RL reading group
источник

EZ

Evgenii Zheltonozhsk... in RL reading group
прям хочется чтобы ктото побил классические шахматные движки нейронкой
источник

AG

Artem Grachev in RL reading group
вот это выдержка у ребят — по 40 дней сетки тренировать)
источник

AG

Aleksey Grinchuk in RL reading group
Здорово же! Она себе считается и есть не просит, а вы в это время с корешами статьи пишете на всякие nipsы, icmlи, пока графики для статьи в nature считаются (:
источник