Интуиция там действительно есть и, скажем так, если максимально «огрубить»:
то, скажем так, если у вас есть одна модель с 5x2 скорами и есть вторая модель, у которой все 5х2 скоров лучше, чем у первой, то вполне можно предположить, что вторая модель действительно лучше отработает на отложенном наборе данных. Но это: 1) не факт 2) на уровне эвристики