Ну с точки зрения как используется бизнесом я понял
Мне именно интересно как такое в облаках реализуют
Надо будет поискать что-нибудь
Да мониторинги на загрузку (CPU, CPU wait, memory, io network и тд) делают и докидывают функцию в новый инстанс, когда расход ресурсов приближается к фазе "надо докинуть ноду". Ну и один физический инстанс держит разные функции (чтоб впустую не выделять машину под одну функцию с 0.01 RPS)