Телеграмм чат группы theoreticalrl страница 28

parrot.ru

Рейтинг популярных групп и каналов

В рейтинге участвует:

групп:

каналов:

Виртуальный сервер на SSD - недорого!

Аренда выделенных и виртуальных серверов (VDS/VPS), хостинг, аренда IP-адресов, администрирование, круглосуточная поддержка

qwarta.ru подробнее

Резервное копирование с проверкой на вирусы!!!

Удобный сервис создания резервных копий на любой сервер сети интернет. Отслеживайте изменения, проверяйте на вирусы. Надежно защитите свой бизнес!

go.backupland.com

Выбираете сервер? Любая конфигурация на заказ!

Аренда физических серверов любых конфигураций под любые запросы - 1С бухгалтерия, игровые сервера, нагруженные проекты, интернет-магазины!

qwarta.ru подробнее

Size: a a a

RL reading group

1092 membersпожаловаться на группу

1
«
…
‹
23
24
25
26
27
28
29
›
…
»

2017 October 03

NP

Nikita Petrenko in RL reading group

а чем retrace(lambda) лучше, чем retrace(lambda == 0), применительно к policy evaluation? Улучшения того же q-learning'а более очевидны из-за того, что его сходимость в случае приближений под вопросом - в случае retrace(0) для evaluation таких проблем просто не возникает

источник

21:53пожаловаться #1

2017 October 04

NP

Nikita Petrenko in RL reading group

вопрос снят - не туда смотрел))

источник

00:31пожаловаться #2

P

Pavel Shvechikov in RL reading group

Ребята, всем добрый вечер!
Завтра, как и объявлялось ранее, будут два замечательнейших доклада. Даже если вы не думали приходить, я бы очень рекомендовал рассмотреть вопрос своего участия.
Сначала Артём сделает обзорный доклад про разнообразные способы обучения нейронных сетей со стохастическими нодами (непрерывными и дискретными).
Затем @ivan_kush расскажет про нашумевшую статью DeepMind про distributional reinforcement learning.

Если кто еще не успел заполнить заявку на пропуск, пожалуйста сделайте это до конца сегодняшнего дня.

источник

21:13пожаловаться #3

AG

Alexander Grishin in RL reading group

Развитие прекрасной на мой взгляд идеи с Hindsight Experience Replay
https://arxiv.org/abs/1709.10089v1

источник

22:16пожаловаться #4

AG

Alexander Grishin in RL reading group

судя по всему, они заметно увеличили sample efficiency

источник

22:18пожаловаться #5

AG

Alexander Grishin in RL reading group

И еще один подход к инкорпорированию демонстраций от Schulman/Levine
https://arxiv.org/abs/1709.10087v1

источник

22:22пожаловаться #6

2017 October 05

EE

Evgenii Egorov in RL reading group

источник

10:55пожаловаться #7

АС

Артём С in RL reading group

Не тот чат?

источник

10:55пожаловаться #8

EB

Evgeny Burnaev in RL reading group

это точно сюда?

источник

10:55пожаловаться #9

EB

Evgeny Burnaev in RL reading group

хм

источник

10:55пожаловаться #10

SS

Sergey Sviridov in RL reading group

Maria а NDA это позволяет?))

источник

10:55пожаловаться #11

EB

Evgeny Burnaev in RL reading group

секретные данные?

источник

10:55пожаловаться #12

EE

Evgenii Egorov in RL reading group

Сбербанк топчик)))

источник

10:56пожаловаться #13

S

Sergey in RL reading group

Leak

источник

10:56пожаловаться #14

S

Sergey in RL reading group

Сохранил на всякий

источник

10:56пожаловаться #15

SS

Sergey Sviridov in RL reading group

@mousehead теперь отнеси в отделение, где карту получал

источник

10:57пожаловаться #16

S

Sergey in RL reading group

источник

10:57пожаловаться #17

N

Nikita in RL reading group

Дорогие огранизаторы! Зарегистировался только сегодня. По требованиям нужно было за день до проведения семинара. Возможно ли попасть на семинар сегодня?

источник

13:12пожаловаться #18

N

Nikita in RL reading group

Прошу прощения за опечатки

источник

13:16пожаловаться #19

P

Pavel Shvechikov in RL reading group

Напиши мне пожалуйста в личку, придумаем, как тебе помочь попасть на семинар.

источник

13:20пожаловаться #20

1
«
…
‹
23
24
25
26
27
28
29
›
…
»