Телеграмм чат группы theoreticalrl страница 55

parrot.ru

Рейтинг популярных групп и каналов

В рейтинге участвует:

групп:

каналов:

Виртуальный сервер на SSD - недорого!

Аренда выделенных и виртуальных серверов (VDS/VPS), хостинг, аренда IP-адресов, администрирование, круглосуточная поддержка

qwarta.ru подробнее

Резервное копирование с проверкой на вирусы!!!

Удобный сервис создания резервных копий на любой сервер сети интернет. Отслеживайте изменения, проверяйте на вирусы. Надежно защитите свой бизнес!

go.backupland.com

Выбираете сервер? Любая конфигурация на заказ!

Аренда физических серверов любых конфигураций под любые запросы - 1С бухгалтерия, игровые сервера, нагруженные проекты, интернет-магазины!

qwarta.ru подробнее

Size: a a a

RL reading group

1092 membersпожаловаться на группу

1
«
…
‹
50
51
52
53
54
55
56
›
…
»

2018 January 24

AR

Andrey Rykov in RL reading group

И какой фреймворк?

источник

19:52пожаловаться #1

EN

Evgenii Nikishin in RL reading group

И почему это в этом чате обсуждается?

источник

19:54пожаловаться #2

R

Radoslav in RL reading group

Evgenii Nikishin

И почему это в этом чате обсуждается?

Много шарящих людей?

источник

19:55пожаловаться #3

R

Radoslav in RL reading group

tf 1.3, лосс поколебался и *сошелся* к одному значению. Ощущение, что правда где-то nan и градиентов нет.

источник

19:56пожаловаться #4

IS

Ivan Skorokhodov in RL reading group

Много шарящих людей?

я предлагаю тогда обсудить, как заливать файлы на ios, наверняка тут многие в этом шарят

источник

20:00пожаловаться #5

AS

Andrew Stepanov in RL reading group

tf 1.3, лосс поколебался и *сошелся* к одному значению. Ощущение, что правда где-то nan и градиентов нет.

Попробуй tfdbg-ом поискать nan или inf

источник

20:26пожаловаться #6

R

Radoslav in RL reading group

Спасибо за наводки, ушел разбираться :)

источник

20:27пожаловаться #7

P

Pavel Shvechikov in RL reading group

Много шарящих людей?

Для этого есть целый ods и горсть чатов про диплернинг. Тут - только про RL.

источник

21:06пожаловаться #8

P

Pavel Shvechikov in RL reading group

И кстати - про RL.
Какие вы знаете постановки задачи, где оптимальная политика - стохастичная (кроме POMDP)?

источник

21:14пожаловаться #9

OV

Oleg Vasilev in RL reading group

Pavel Shvechikov

И кстати - про RL.
Какие вы знаете постановки задачи, где оптимальная политика - стохастичная (кроме POMDP)?

я вот знаю задачу про бандита и полицейского :)

источник

21:30пожаловаться #10

EG

Evgeniy Golikov in RL reading group

Бандит многорукий?

источник

21:31пожаловаться #11

OV

Oleg Vasilev in RL reading group

Evgeniy Golikov

Бандит многорукий?

я бы сказал, многорукий полицейский

источник

21:32пожаловаться #12

C

Constantine in RL reading group

камни-ножницы-бумага, да и вообще игры со смешанной стратегией

источник

21:33пожаловаться #13

OV

Oleg Vasilev in RL reading group

камни-ножницы-бумага, да и вообще игры со смешанной стратегией

ну это тоже pomdp

источник

21:33пожаловаться #14

IS

Ivan Skorokhodov in RL reading group

Pavel Shvechikov

И кстати - про RL.
Какие вы знаете постановки задачи, где оптимальная политика - стохастичная (кроме POMDP)?

имеется в виду, где детерменированная политика не может быть оптимальной?

источник

21:33пожаловаться #15

C

Constantine in RL reading group

ну это тоже pomdp

да, не понял вопрос.

источник

21:35пожаловаться #16

P

Pavel Shvechikov in RL reading group

Ivan Skorokhodov

имеется в виду, где детерменированная политика не может быть оптимальной?

Ага

источник

21:36пожаловаться #17

DP

Dmitry Persiyanov in RL reading group

В многоруком бандите же детерминированная оптимальная, нет?
Может быть в нестационарном бандите? Где распределение ревордов постоянно меняется (но это не классическая RL постановка)

источник

21:36пожаловаться #18

A

Arseny in RL reading group

Мне кажется, что в саттоне доказывают, что в MDP всегда можно построить детерминированную оптимальную, или я ошибаюсь?

источник

21:36пожаловаться #19

P

Pavel Shvechikov in RL reading group

Мне кажется, что в саттоне доказывают, что в MDP всегда можно построить детерминированную оптимальную, или я ошибаюсь?

Не ошибаешься

источник

21:36пожаловаться #20

1
«
…
‹
50
51
52
53
54
55
56
›
…
»