Телеграмм чат группы theoreticalrl страница 150

спасибо за таблицу, кстати, она очень полезная

22:56пожаловаться #1

Vlad Kurenkov

reinforce (https://ray.readthedocs.io/en/latest/rllib-algorithms.html#policy-gradients), кстати, у них тоже реализован — там если в код полезть может показаться, что апдейт всё-равно похож на a2c, но по-факту нет, т.к у них реализован подсчёт advantage только через GAE (https://github.com/ray-project/ray/blob/master/python/ray/rllib/evaluation/postprocessing.py#L61), а в reinforce они его не используют (https://github.com/ray-project/ray/blob/master/python/ray/rllib/agents/pg/pg_policy.py#L28)

фух, а то был сильно удивлен, что reinforce нет
но и pg сойдет

22:56пожаловаться #2

Ребят. В продакте пока RL нет же ? Где нибудь вообще широко используется ? Можно ли где-то прогнозы на область прочитать?

22:57пожаловаться #3

Gleb Sterkin in RL reading group

Бандиты вон направо и налево даже в гугланалитике

22:58пожаловаться #4

переводы, комбинаторные оптимизации, поиски путей в графе, немного self-driving, кто-то заводил под HFT

Evgenii Zheltonozhsk... in RL reading group

22:59пожаловаться #5

переводы, комбинаторные оптимизации, поиски путей в графе, немного self-driving, кто-то заводил под HFT

Очень тяжело проверить в хфт🙈

23:00пожаловаться #6

Я так понимаю как основа ИИ для игр не годится ?

23:00пожаловаться #7

Кто может сказать в двух словах в чем проблема RL ? Вычислительной мощи не хватает ?

23:02пожаловаться #8

Я так понимаю как основа ИИ для игр не годится ?

для геймдева, кажется, что пока достаточно нерелевантно

23:02пожаловаться #9

Или сложность проектирования среды

23:02пожаловаться #10

Vlad Kurenkov

для геймдева, кажется, что пока достаточно нерелевантно

why so? unity agents потихонку развиваются
если не хотеть ААА, то что-то ламповое, маленькое и с RL придумать можно

23:03пожаловаться #11

See All in RL reading group

why so? unity agents потихонку развиваются
если не хотеть ААА, то что-то ламповое, маленькое и с RL придумать можно

придумать != используется и приносит деньги

23:04пожаловаться #12

why so? unity agents потихонку развиваются
если не хотеть ААА, то что-то ламповое, маленькое и с RL придумать можно

а толку почти никакого, только если рл для рл

23:04пожаловаться #13

всё остальное решается обычными фсмами/фуззи логикой/деревьями

23:04пожаловаться #14

комон, не в деньгах счастье, тут сам концепт интересен

23:05пожаловаться #15

See All in RL reading group

комон, не в деньгах счастье, тут сам концепт интересен

ладно, даже если не в деньгах - в применимости

23:05пожаловаться #16

придёт к тебе геймдизайнер и скажет: ну ваще не весело, вот примерно так будет веселее

23:05пожаловаться #17

и что делать

23:05пожаловаться #18

Я так понимаю компьютерное зрение и RL это вообще что-то нереальное?

23:06пожаловаться #19

See All in RL reading group

Я так понимаю компьютерное зрение и RL это вообще что-то нереальное?

ну да, CV нигде не применяется - ни в медицине, ни в сателитах, ни в ритейле, стартапов по камерам тоже нуль