Size: a a a

RL reading group

2019 November 24

PK

Petr Kuderov in RL reading group
А на следующей неделе планируется семинар?
источник

A

Alexander O in RL reading group
если статью разберешь, то будет семинар
источник
2019 November 26

P

Pavel Shvechikov in RL reading group
Никто не может подсказать работы, где для уменьшения overestimation bias предлагают вычислять таргет для обучения Q как линейную комбинацию между минимумом и максимумом по набору Q-функций?
источник

AP

Anton Pechenko in RL reading group
В BCQ это есть
источник

P

Pavel Shvechikov in RL reading group
Anton Pechenko
В BCQ это есть
Ага, и в BEAR тоже.
Но вроде они не первые, хотя никого не цитируют.
источник
2019 November 27

c

cydoroga in RL reading group
Всем привет!

На этой неделе семинара не будет.
Но!

Мы посоветовались вместе с @supergriver и @sergeysviridov , и решили, что было бы круто провести цикл лекций по advanced RL в рамках нашего семинара.

Как обычно, участие добровольное.
В течение каждой лекции выступающий пытается охватить какую-то из тем (которую он сам выберет), основываясь на нескольких статьях. Идея в том, чтобы одновременно показать разные подходы, но и не забыть про тонкости реализации конкретных методов.

Каждый из вас, кто хотел бы попробовать разобрать одну из тем на нашем семинаре, должен сделать следующее:

1) пройти по ссылке на гугл-форму и выбрать интересную тему \ темы:
https://forms.gle/YyBZsZE5gvwP6k818
2) выбрать список статей, методов, идей, которые стоило бы разобрать в рамках доклада (@supergriver, @sergeysviridov и я @cydoroga всегда готовы помочь)
3) подготовить выступление и сделать презентацию


Лекции будут проходить в привычном месте:
ШАД
ул. Тимура Фрунзе, 11 корпус 2

Кроме этого, хотелось бы обсудить день и время наших встреч. Пока что, обычная опция - четверг, 19:00
Но есть ощущение, что удобно это не всем.
Поэтому я тут еще сразу запущу опросник, в котором можно отметить, когда вам вообще удобно посещать семинар:
https://forms.gle/1vkzWoRPnrchnZ5YA
источник

c

cydoroga in RL reading group
И ещё одно объявление для студентов ШАД, которые бы хотели зачесть участие в семинаре в качестве оценки в ШАДе!

До 20го числа у нас остаётся три семинара
Выступление на семинаре с лекцией по одной из тем, приведённых выше, можно будет зачесть в качестве спецсеминара ШАД!

Так что, если хотите, спешите)
Пишите мне
источник

LG

Leonid Gremyachikh in RL reading group
cydoroga
Всем привет!

На этой неделе семинара не будет.
Но!

Мы посоветовались вместе с @supergriver и @sergeysviridov , и решили, что было бы круто провести цикл лекций по advanced RL в рамках нашего семинара.

Как обычно, участие добровольное.
В течение каждой лекции выступающий пытается охватить какую-то из тем (которую он сам выберет), основываясь на нескольких статьях. Идея в том, чтобы одновременно показать разные подходы, но и не забыть про тонкости реализации конкретных методов.

Каждый из вас, кто хотел бы попробовать разобрать одну из тем на нашем семинаре, должен сделать следующее:

1) пройти по ссылке на гугл-форму и выбрать интересную тему \ темы:
https://forms.gle/YyBZsZE5gvwP6k818
2) выбрать список статей, методов, идей, которые стоило бы разобрать в рамках доклада (@supergriver, @sergeysviridov и я @cydoroga всегда готовы помочь)
3) подготовить выступление и сделать презентацию


Лекции будут проходить в привычном месте:
ШАД
ул. Тимура Фрунзе, 11 корпус 2

Кроме этого, хотелось бы обсудить день и время наших встреч. Пока что, обычная опция - четверг, 19:00
Но есть ощущение, что удобно это не всем.
Поэтому я тут еще сразу запущу опросник, в котором можно отметить, когда вам вообще удобно посещать семинар:
https://forms.gle/1vkzWoRPnrchnZ5YA
Очень круто
Было идеально ещё что-то покодить или хотя бы на готовый код разобрать
источник

SK

Sergey Kolesnikov in RL reading group
Leonid Gremyachikh
Очень круто
Было идеально ещё что-то покодить или хотя бы на готовый код разобрать
практика - неотъемлемая часть всей этой инициативы
источник

SK

Sergey Kolesnikov in RL reading group
с этим мы... поможем))
источник

TK

Taras Khakhulin in RL reading group
Sergey Kolesnikov
с этим мы... поможем))
с каждого лектора pull-request в catalyst c ноутбуком/туториалом?)
источник

c

cydoroga in RL reading group
Мне кажется, какое-то количество кода не повредит никакому выступлению
Мы этому всегда рады)

Иллюстрация готового кода - вообще огонь

Но прям требовать имплементаций для такого формата, наверное нет смысла (много слишком)

Мы сейчас ещё думаем о другом типе докладов, где упор будет на именно имплементацию и какой-то честный анализ методов

Стей тюнед, эз ви лайк ту сей ин Раша
источник

SK

Sergey Kolesnikov in RL reading group
Taras Khakhulin
с каждого лектора pull-request в catalyst c ноутбуком/туториалом?)
скорее, это я должен подготовить экосистему для удобных экспериментов и скейлинга
источник

SS

Sergey Sviridov in RL reading group
Sergey Kolesnikov
скорее, это я должен подготовить экосистему для удобных экспериментов и скейлинга
источник
2019 November 30

PK

Petr Kuderov in RL reading group
а есть желание разобрать MuZero?
источник

PK

Petr Kuderov in RL reading group
Переслано от Aleksey Grinchuk
источник
2019 December 01

CP

Cherry Pie in RL reading group
Petr Kuderov
а есть желание разобрать MuZero?
Поддерживаю, было бы круто послушать про MuZero
источник

NK

Nikita Kostin in RL reading group
Очень интересно!
источник
2019 December 02

SK

Sergey Kolesnikov in RL reading group
гайз, интереса ради, а кому-нибудь было интересно послушать overview за RL frameworks от google/facebook/etc
что сделали, почему вообще круто, что еще не круто и как это сравнили с конкурентами?

а то в связи с Catalyst.RL 2.0 успел эдак.... статей 10+ прочитать, разобрать, оценить
источник

A

Alexander O in RL reading group
Sergey Kolesnikov
гайз, интереса ради, а кому-нибудь было интересно послушать overview за RL frameworks от google/facebook/etc
что сделали, почему вообще круто, что еще не круто и как это сравнили с конкурентами?

а то в связи с Catalyst.RL 2.0 успел эдак.... статей 10+ прочитать, разобрать, оценить
Да
источник