Артём Глазунов
Хм, интересно. Но если это для ограничения величины выхода линейной части перед подачей в активацию, то батч норм , по идее, все и так ограничит и приведет к нужному распределению..
Тут мне сложно говорить о математической подоплеке, честно говоря. Скорее всего цель у этого иная. Во всяком случае не раз видел сочетание и батчнорм, и нормализации весов. Но лучше детальнее изучить, конечно