Ну у вас и для kfold тоже будет "небольшое". Те же проблемы
Думаете? Кажется, что явно больше для к фолд засчёт того, что модель обучена на фолде, а потом ещё и тестируется на другом, в результате фолды и метрики связаны... Тут же этой связи нет, но есть предполагаемая корреляции сэмплов, которая тем меньше, чем меньше размер бутстрап сэмпла... Но, в вопросе независимости интуиция плохой друг.. Тут надо или источники найти, где измерения корреляции для подобных метрик, либо самому пробовать...