Ребята, всем добрый вечер!
Завтра, будет два действительно знаментаельных события.
Во-первых, несмотря на то, что distributional RL ускользал от рассмотрения нашей группой дважды, мы все-таки наконец настигли врага “врасплох”, и завтра, верится мне, мы дойдем до самого дна этой работы благодаря усердию и старанию
Aleksey!
Во-вторых, наконец-то, спустя почти полгода, как Q-prop появился впервые в наших списках, нашелся герой (
Nikita), который принял вызов и завтра расскажет Вам о том, что же такого необычного нашли в работе ревьюеры ICLR2017 и почему соединять off-policy & on-policy learning может быть хорошей идеей.
Если кто еще не успел заполнить
заявку на пропуск, пожалуйста сделайте это
до конца сегодняшнего дня.