Size: a a a

RL reading group

2017 October 03

NP

Nikita Petrenko in RL reading group
а чем retrace(lambda) лучше, чем retrace(lambda == 0), применительно к policy evaluation? Улучшения того же q-learning'а более очевидны из-за того, что его сходимость в случае приближений под вопросом - в случае retrace(0) для evaluation таких проблем просто не возникает
источник
2017 October 04

NP

Nikita Petrenko in RL reading group
вопрос снят - не туда смотрел))
источник

P

Pavel Shvechikov in RL reading group
Ребята, всем добрый вечер!
Завтра, как и объявлялось ранее, будут два замечательнейших доклада. Даже если вы не думали приходить, я бы очень рекомендовал рассмотреть вопрос своего участия.
Сначала Артём сделает обзорный доклад про разнообразные способы обучения нейронных сетей со стохастическими нодами (непрерывными и дискретными).
Затем @ivan_kush расскажет про нашумевшую статью  DeepMind про distributional reinforcement learning.

Если кто еще не успел заполнить заявку на пропуск, пожалуйста сделайте это до конца сегодняшнего дня.
источник

AG

Alexander Grishin in RL reading group
Развитие прекрасной на мой взгляд идеи с Hindsight Experience Replay
https://arxiv.org/abs/1709.10089v1
источник

AG

Alexander Grishin in RL reading group
судя по всему, они заметно увеличили sample efficiency
источник

AG

Alexander Grishin in RL reading group
И еще один подход к инкорпорированию демонстраций от Schulman/Levine
https://arxiv.org/abs/1709.10087v1
источник
2017 October 05

EE

Evgenii Egorov in RL reading group
источник

АС

Артём С in RL reading group
Не тот чат?
источник

EB

Evgeny Burnaev in RL reading group
это точно сюда?
источник

EB

Evgeny Burnaev in RL reading group
хм
источник

SS

Sergey Sviridov in RL reading group
Maria а NDA это позволяет?))
источник

EB

Evgeny Burnaev in RL reading group
секретные данные?
источник

EE

Evgenii Egorov in RL reading group
Сбербанк топчик)))
источник

S

Sergey in RL reading group
Leak
источник

S

Sergey in RL reading group
Сохранил на всякий
источник

SS

Sergey Sviridov in RL reading group
@mousehead теперь отнеси в отделение, где карту получал
источник

S

Sergey in RL reading group
источник

N

Nikita in RL reading group
Дорогие огранизаторы! Зарегистировался только сегодня. По требованиям нужно было за день до проведения семинара. Возможно ли попасть на семинар сегодня?
источник

N

Nikita in RL reading group
Прошу прощения за опечатки
источник

P

Pavel Shvechikov in RL reading group
Напиши мне пожалуйста в личку, придумаем, как тебе помочь попасть на семинар.
источник