это разница в методах достижения одной и той же цели -- декорреляции прогнозов базовых алгоритмов для увеличения эффекта уменьшения дисперсии от усреднения. В лесу этого добиваются бэггингом, построения расщепления на подмножествах признаков и тд, а в сетях -- на разной случайной инициализации весов, но сути это не меняет