Описание игры
Вместо чашек к весам прикреплены бесконечные сосуды/кувшины с регулируемым диаметром входного отверстия.
Макс. диаметры вх. отверстий кувшинов разные и известы, минимальные == 0 у обоих.
Изначально оба сосуда пусты или в них одинаковое кол-во воды — весы находятся в равновесии.
Начало игры — начался дождь.
Справа и слева от весов он случайный независимый от сторон.
Дождь начинается и заканчивается случайно одновременно справа и слева.
Окончание дождя — окончание игры
Задача:
1. Собрать как можно больше воды в кувшины, управляя диаметром вх. отверстий кувшинов.
2. Весы к окончанию дождя быть как можно ближе к точке равновесия.
3. Во время дождя не допустить разницы в весе кувшинов более чем 5%
4. Данные о ходе дождя можно представить как лог из полей:
datetime, сторона, вес_капли, расстояние_от_центра_входного_отверстия_кувшина
Плз, помогите решить - куда копать?
к какой типовой задаче RL проще свести? к тележке?
Заранее спасибо за все рекомендации и/или ссылки.