Может кто-то подсказать, зачем после свертки и пулинга используют какую-либо функции активации, например, ReLU, разве пулинговый слой и так не сжимает изображение?
разве после? Активационная ведь в свертке находится, а потом уже пулинг
В результате гуглинга выяснил, что свертка линейная операция, а пулинг просто сжимает изображение, поэтому чтобы модель могла распознавать более сложные фичи нужно добавить нелинейности, а простейший способ это сделать — ReLU
Может кто-то подсказать, зачем после свертки и пулинга используют какую-либо функции активации, например, ReLU, разве пулинговый слой и так не сжимает изображение?