Size: a a a

RL reading group

2017 September 14

AP

Anton Pechenko in RL reading group
Я как обычно наверное сделаю трансляцию на ютуб
источник

AP

Anton Pechenko in RL reading group
источник

AP

Anton Pechenko in RL reading group
трансляця
источник

c

cydoroga in RL reading group
Вопрос лектору
источник

c

cydoroga in RL reading group
а с месседж пассинг из belief propagation в вероятностных моделях связь есть? выглядит оч похоже
источник

EG

Evgeniy Golikov in RL reading group
Мы теперь навсегда переехали в другую аудиторию? На всех её явно не хватает
источник

IB

Ivan Baskov in RL reading group
Evgeniy Golikov
Мы теперь навсегда переехали в другую аудиторию? На всех её явно не хватает
Это вы еще на байесовских методах в Гарварде не были
источник

P

Pavel Shvechikov in RL reading group
Evgeniy Golikov
Мы теперь навсегда переехали в другую аудиторию? На всех её явно не хватает
Будем смотреть, как пойдет.
источник

PC

Pika Chu in RL reading group
Да, ладно. Было вполне уютно. Правда стульев не хватало.
источник
2017 September 15

P

Pavel Shvechikov in RL reading group
OpenAI подбираются к мультиагентным системам
https://blog.openai.com/learning-to-model-other-minds/
источник

LV

Liza Vakhrameeva in RL reading group
Поправьте, пожалуйста, ссылки на вчерашние презентации, там ссылка просто на гугл диск.
источник

IK

Ivan Kush in RL reading group
не подскажете, как value function на русский переводить?
источник

DP

Dmitry Persiyanov in RL reading group
Функция полезности?
источник

AB

Alexey Boyko in RL reading group
не совсем, это функция ценности
источник

AG

Artem Grachev in RL reading group
мне кажется, если говорить про общепринятый термин в русской литературе ,то это всё-таки функция полезности
источник

P

Pavel Shvechikov in RL reading group
Artem Grachev
мне кажется, если говорить про общепринятый термин в русской литературе ,то это всё-таки функция полезности
Кажется не соглашусь.
Функция полезности это utility function из литературы посвященной рациональному выбору в экономических и социологических моделях.
источник

P

Pavel Shvechikov in RL reading group
Alexey Boyko
не совсем, это функция ценности
Я бы голосовал за этот термин
источник

AG

Aleksey Grinchuk in RL reading group
В RL тоже есть понятие utility function, кажется. Ребята из BAIR называют utility function функционал J(\theta), который минимизируется в PG methods и по сути является V(s_0).
источник

P

Pavel Shvechikov in RL reading group
Граница между понятиями очень зыбкая.
http://andrewgelman.com/2007/10/25/dont_say_utilit/
Я бы сказал, что utility отличается от value тем, что первую можно посчитать, а вторую только оценить.
Ребята из BAIR пришли из мира опт управления, где cost - заданная функция, которую можно посчитать. И если речь идёт про их статью о комбинации model free и model based - то там как раз cost есть заданная функция.
Но это конечно с моей колокольни так видится. Буду рад услышать альтернативное мнение.
источник
2017 September 16

P

Pavel Shvechikov in RL reading group
When waiting is not an option: learning options with a deliberation cost (https://arxiv.org/abs/1709.04571) – анализирует, что же такое такое макро действия и как их правильно учить это выучивать с нуля.
источник