Где можно почитать, почему AlexNet и другие архитектуры работают, т.е.чем руководствовался создатель, когда собирал именно такую архитектуру, в research paper ничего нет?
Хм это на самом деле пальцем в небо. Вопрос почему нейронные сети работают в принципе все еще остаётся открытым. Есть несколько теорем для доказательства что нейронкой (перцептроном) можно аппроксимировать любую функцию, но почему нейронки работают с распознаванием изображений, генерацией текстов и т.п- неизвестно. У Алекснета была простая идея: надо чтобы сетка научилась смотреть некоторую область, а не один пиксель. А сама идея сверточных нейронок была придумана как и многие другие еще в 90ые