обычно, конечно, алгоритмы, обученные на разных сидах, получаются чересчур скоррелированными. Поэтому ясное дело их усреднение никакого профита не приносит (но и не ухудшает качество, ясное дело). Но в данной сореве, сетки, по всей видимости, попадают в достаточно разные локальные минимумы при разной инициализации -- поэтому тут это и работает