собственно, а в чем сложность?
у Atari один observation - это картинка [84, 84, 1], вроде ничего complicated, за исключеним того, что таких картинок хранить ~1M, а то и 10M…в памяти….ибо ты по ним итерируешься постоянно и учишься
ну а 1M таких картинок - это ~7GB RAM… 10M - 70GB, короче, все печально становится…. особенно когда хочется несколько параллельно обучаться поставить
+ чтобы сихронизировать все между Train Node (которая как раз учит сетку) и Samplers Nodes (куча тредов, которые играют) нужна еще и DB какая… еще RAM
т.е. RAM жрется как не в коня
и чтобы как-то зарешать этот вопросик, приваял MongoDB + memmap… вжух-вжух и все (окей, большинство) хранится теперь на диске, а не на RAM и даже скорость не проседает