Size: a a a

RL reading group

2019 July 23

VK

Vlad Kurenkov in RL reading group
спасибо за таблицу, кстати, она очень полезная
источник

SK

Sergey Kolesnikov in RL reading group
Vlad Kurenkov
reinforce (https://ray.readthedocs.io/en/latest/rllib-algorithms.html#policy-gradients), кстати, у них тоже реализован — там если в код полезть может показаться, что апдейт всё-равно похож на a2c, но по-факту нет, т.к у них реализован подсчёт advantage только через GAE (https://github.com/ray-project/ray/blob/master/python/ray/rllib/evaluation/postprocessing.py#L61), а в reinforce они его не используют (https://github.com/ray-project/ray/blob/master/python/ray/rllib/agents/pg/pg_policy.py#L28)
фух, а то был сильно удивлен, что reinforce нет
но и pg сойдет
источник

A

Aiz3k in RL reading group
Ребят. В продакте пока RL нет же ? Где нибудь вообще широко используется ? Можно ли где-то прогнозы на область прочитать?
источник

GS

Gleb Sterkin in RL reading group
Aiz3k
Ребят. В продакте пока RL нет же ? Где нибудь вообще широко используется ? Можно ли где-то прогнозы на область прочитать?
Бандиты вон направо и налево даже в гугланалитике
источник

SK

Sergey Kolesnikov in RL reading group
Aiz3k
Ребят. В продакте пока RL нет же ? Где нибудь вообще широко используется ? Можно ли где-то прогнозы на область прочитать?
переводы, комбинаторные оптимизации, поиски путей в графе, немного self-driving, кто-то заводил под HFT
источник

EZ

Evgenii Zheltonozhsk... in RL reading group
Sergey Kolesnikov
переводы, комбинаторные оптимизации, поиски путей в графе, немного self-driving, кто-то заводил под HFT
Очень тяжело проверить в хфт🙈
источник

A

Aiz3k in RL reading group
Я так понимаю как основа ИИ для игр не годится ?
источник

A

Aiz3k in RL reading group
Кто может сказать в двух словах в чем проблема RL ? Вычислительной мощи не хватает ?
источник

VK

Vlad Kurenkov in RL reading group
Aiz3k
Я так понимаю как основа ИИ для игр не годится ?
для геймдева, кажется, что пока достаточно нерелевантно
источник

A

Aiz3k in RL reading group
Или сложность проектирования среды
источник

SK

Sergey Kolesnikov in RL reading group
Vlad Kurenkov
для геймдева, кажется, что пока достаточно нерелевантно
why so? unity agents потихонку развиваются
если не хотеть ААА, то что-то ламповое, маленькое и с RL придумать можно
источник

SA

See All in RL reading group
Sergey Kolesnikov
why so? unity agents потихонку развиваются
если не хотеть ААА, то что-то ламповое, маленькое и с RL придумать можно
придумать != используется и приносит деньги
источник

VK

Vlad Kurenkov in RL reading group
Sergey Kolesnikov
why so? unity agents потихонку развиваются
если не хотеть ААА, то что-то ламповое, маленькое и с RL придумать можно
а толку почти никакого, только если рл для рл
источник

VK

Vlad Kurenkov in RL reading group
всё остальное решается обычными фсмами/фуззи логикой/деревьями
источник

SK

Sergey Kolesnikov in RL reading group
комон, не в деньгах счастье, тут сам концепт интересен
источник

SA

See All in RL reading group
Sergey Kolesnikov
комон, не в деньгах счастье, тут сам концепт интересен
ладно, даже если не в деньгах - в применимости
источник

VK

Vlad Kurenkov in RL reading group
придёт к тебе геймдизайнер и скажет: ну ваще не весело, вот примерно так будет веселее
источник

VK

Vlad Kurenkov in RL reading group
и что делать
источник

A

Aiz3k in RL reading group
Я так понимаю компьютерное зрение и RL  это вообще что-то нереальное?
источник

SA

See All in RL reading group
Aiz3k
Я так понимаю компьютерное зрение и RL  это вообще что-то нереальное?
ну да, CV нигде не применяется - ни в медицине, ни в сателитах, ни в ритейле, стартапов по камерам тоже нуль
источник