Size: a a a

RL reading group

2017 November 12

P

Pavel Shvechikov in RL reading group
Department of Computer Science, University of Oxford: Publication - Dynamic−Depth Context Tree Weighting
http://www.cs.ox.ac.uk/publications/publication11278-abstract.html
источник

P

Pavel Shvechikov in RL reading group
Marlos C Machado (University of Alberta) – Revisiting the Arcade Learning Environment
https://vimeo.com/241533065
источник
2017 November 13

P

Pavel Shvechikov in RL reading group
[1705.08926] Counterfactual Multi-Agent Policy Gradients
https://arxiv.org/abs/1705.08926
источник

P

Pavel Shvechikov in RL reading group
[1711.02257] GradNorm: Gradient Normalization for Adaptive Loss Balancing in Deep Multitask Networks
https://arxiv.org/abs/1711.02257
источник

P

Pavel Shvechikov in RL reading group
[1705.08439] Thinking Fast and Slow with Deep Learning and Tree Search
https://arxiv.org/abs/1705.08439
источник
2017 November 14

AG

Aleksey Grinchuk in RL reading group
источник

AG

Aleksey Grinchuk in RL reading group
CARLA: An Open Urban Driving Simulator

Фрейморк на базе GTA 5 для autonomous driving research. Новости не очень: RL там плоховат по сравнению с другими методами.
источник

AG

Artem Grachev in RL reading group
да RL много где плоховат.
Это скорей говорит о том, что ему ещё есть куда развиваться
источник

KO

Konstantin Ostrovsky in RL reading group
[1706.02275] Multi-Agent Actor-Critic for Mixed Cooperative-Competitive Environments
https://arxiv.org/abs/1706.02275
источник
2017 November 15

P

Pavel Shvechikov in RL reading group
[1711.02827] Inverse Reward Design
https://arxiv.org/abs/1711.02827
источник

P

Pavel Shvechikov in RL reading group
Коллеги, добрый вечер!

Завтра будет два доклада.
Сначала  @omtcyfz расскажет про любопытную недавнюю поделку Sutton, в частности про обобщение многошагового Q-обучения.
Затем Konstantin немного поведает о том, что происходит в мире мультиагентного RL — темы, которая практически всегда обходится стороной в разных курсах по RL.  Stacraft included.

Регистрируйтесь, как обычно, до конца сегодняшнего дня по ссылке из шапки.
источник

AP

Anton Pechenko in RL reading group
SC - это круто!
источник

SK

Sergey Kolesnikov in RL reading group
привет всем любителям RL!
закончился NIPS RL, и мы с @fgvbrt прошли через многое, чтобы выйти на 3е место. Если кому будет интересно послушать эту историю - думаем зайти в декабре и рассказать. @Parilo также очень интересно узнать и про твою решение (мы за ним внимательно следили)
PS. хотите исходники? они есть у меня
https://github.com/Scitator/Run-Skeleton-Run
https://github.com/fgvbrt/nips_rl
источник

EZ

Evgenii Zheltonozhsk... in RL reading group
отрыв конечно приличный
источник

AP

Anton Pechenko in RL reading group
Самое интересное, что ваше решение не просело от препятствий, это круто)
источник
2017 November 16

P

Pavel Shvechikov in RL reading group
Sergey Kolesnikov
привет всем любителям RL!
закончился NIPS RL, и мы с @fgvbrt прошли через многое, чтобы выйти на 3е место. Если кому будет интересно послушать эту историю - думаем зайти в декабре и рассказать. @Parilo также очень интересно узнать и про твою решение (мы за ним внимательно следили)
PS. хотите исходники? они есть у меня
https://github.com/Scitator/Run-Skeleton-Run
https://github.com/fgvbrt/nips_rl
Давайте тогда на 21 декабря попросим @Scitator , @Parilo , @fgvbrt рассказать о столь достойных подвигах?
Как Вы, сможете ?
источник

AP

Anton Pechenko in RL reading group
21 декабря я не смогу, в отпуск уеду середины декабря
источник

EP

Egor Panfilov in RL reading group
Может лучше попросить ребят на тренировке в Я выступить? Качество записи будет выше, и больше аудитория 🙂
источник

AP

Anton Pechenko in RL reading group
я не против, но будет ли интересно мое 16-ое место?)
источник

SO

Sergey Ovcharenko in RL reading group
конечно будет
источник