Отдельное спасибо за сегодняшние вопросы. По поводу log(MSE) на figure 1: MSE - это же и есть дисперсия (среднеквадратичное отклонение градиента от его среднего). Просто эта терминология в контексте дисперсии тут, быть может, не очень уместна. Что касается вопроса "Почему FitQ-MLP на Figure 1 ниже чем MinVar-MLP", то вопрос хороший, тут действительно неясно, почему так. Что касается вопроса про continuous control, то в их работе действительно рассматривается только этот случай и все тесты проводились только на играх с непрерывным пространством действий