Size: a a a

RL reading group

2017 July 28

AP

Anton Pechenko in RL reading group
Ты имеешь в виду одинаковые сетки использовать?
источник

DP

Dmitry Persiyanov in RL reading group
Ну не совсем, я про то что критик должен быть линейной комбинацией градиента лог полиси, вот это вот все
источник

DP

Dmitry Persiyanov in RL reading group
Чтобы policy gradient теорема оставалась верна для аппроксимации Q-функции, нужно чтобы выполнялось это требование, и еще одно (минимизация MSE)
источник

DP

Dmitry Persiyanov in RL reading group
То есть: изначально PG-теорема выведена для истинной Q-функции. Если мы меняем ее на аппроксимацию, то не факт что градиент остается верным (появляется смещение изза аппроксимации). Но вот типа если аппроксимация "хорошая" в смысле этих двух пунктов, то зашибись
источник

DP

Dmitry Persiyanov in RL reading group
Просто в статье DPG они эксперименты делают на compatible аппроксимациях, и я вот задумался, может есть статьи какие-то, где исследуют важность этого
источник

DP

Dmitry Persiyanov in RL reading group
Хотя, в статье DDPG они на это забивают и пилят критика нейросеткой, поэтому видимо надо по задаче смотреть
источник
2017 August 02

JH

Just Heuristic in RL reading group
Привет!  Коллеги, на завтра срочно нужен ещё один докладчик. Есть ли желающие?
источник

JH

Just Heuristic in RL reading group
Коллеги, простите, завтра семинара не будет (не набралось желающих докладчиков).
Через неделю возобновим работу.
источник
2017 August 09

EZ

Evgenii Zheltonozhsk... in RL reading group
источник

P

Pavel Shvechikov in RL reading group
Всем доброго вечера!
Завтра планируется наш очередной RL семинар,  в ходе которого @gri_alex нас познакомит с новым подходом к решению задачи zero-shot transfer для задач обучения с подкреплением.
А чуть позже, @Omrigan расскажет о том, как с помощью RL подбирать архитектуру нейросети с ограничениями на максимальную скорость выполнения прямого прохода, на точность предсказания и прочими чудесами.

ВНИМАНИЕ
(1)    Семинар завтра начнется в необычное время – в 19:30 !
(2)    Если кто еще не записался в гуглоформу, но хочет прийти на семинар – пожалуйста заполните ее до конца сегодняшнего дня.
источник

AP

Anton Pechenko in RL reading group
SC2 крутяк!
источник

AG

Artem Grachev in RL reading group
Ну наконец-то! Как же я этого ждал)
источник

AG

Artem Grachev in RL reading group
не то чтобы сейчас всё зарешаем, но всё равно...
источник
2017 August 10

d

dmitry in RL reading group
@ipaulo Только что увидел последние сообщения и зарегистрировался. Я смогу к вам сегодня прийти?
источник

P

Pavel Shvechikov in RL reading group
Постараюсь сделать все возможное : ) если что - мой телефон 89164633105, пропустим а любом случае
источник

d

dmitry in RL reading group
@ipaulo спасибо, телефон запишу
источник

AP

Anton Pechenko in RL reading group
источник

AP

Anton Pechenko in RL reading group
трансляция
источник

R

Radoslav in RL reading group
У кого-нибудь звук есть?
источник

AN

Arseny Nazarkin in RL reading group
нет (
источник