Size: a a a

RL reading group

2017 December 12

EZ

Evgenii Zheltonozhsk... in RL reading group
Efficient Probabilistic Performance Bounds for Inverse Reinforcement Learning https://arxiv.org/abs/1707.00724
источник

EZ

Evgenii Zheltonozhsk... in RL reading group
заметки с NIPS, есть довольно много RL
источник

EZ

Evgenii Zheltonozhsk... in RL reading group
источник

V

Vadim in RL reading group
источник

V

Vadim in RL reading group
cпасибо
источник
2017 December 13

📒

📒 in RL reading group
туториал с нипса по I2A по которому был семинар как то
https://github.com/vasiloglou/mltrain-nips-2017/blob/master/sebastien_racaniere/I2A%20-%20NIPS%20workshop.ipynb
источник

P

Pavel Shvechikov in RL reading group
Коллеги, всем привет!

Завтра у нас планируется заключительный в этом году семинар, на котором Михаил совершенно героически расскажет про связь  между value-based и policy-based методами. Ожидается работа ума и выкладки на доске.

Если вам интересна одна из последних тенденций в RL, пожалуйста, регистрируйтесь на семинар до конца сегодняшнего дня.
Всем хорошей недели!
источник
2017 December 14

EZ

Evgenii Zheltonozhsk... in RL reading group
Robust Deep Reinforcement Learning with Adversarial Attacks https://arxiv.org/abs/1712.03632
источник

AP

Anton Pechenko in RL reading group
источник

AP

Anton Pechenko in RL reading group
трансляция
источник

AP

Anton Pechenko in RL reading group
Видно, слышно?
источник

K

Kolyan in RL reading group
да
источник

AG

Aleksey Grinchuk in RL reading group
источник

AM

Aleksandr Mikhailov ... in RL reading group
в этой статье пишут, что в q-learning еще не зафикисрована стратегия pi, поэтому ее предлагается взять pi_{theta}^B. Так что кажется такой финт с подменой распределений делать можно)
источник

AM

Aleksandr Mikhailov ... in RL reading group
т.е. вроде бы методы совпадают, но при условии, что после того, как получены оценки для E(r|a), применяется pi_{theta}^B для выбора a.
источник
2017 December 15

AP

Anton Pechenko in RL reading group
Ребята, стыдно спрашивать) Подскажите какой-нибудь хороший онлайн курс по математической статистике
источник

AP

Anton Pechenko in RL reading group
Желательно видео-курс
источник

IK

Ivan Kush in RL reading group
наши биологи восхищались от https://stepik.org/course/76/
источник

AM

Aleksandr Mikhailov ... in RL reading group
интересует теория или практика?
источник

AM

Aleksandr Mikhailov ... in RL reading group
если практика - то курс из специализации яндекса по машинному обучению на курсере хороший
источник