добрый день! а кто сталкивался с проблемой обновления нод групп(AWS ASG(Spots)), когда подымаешь капасити в два раза всё хорошо, но когда понижаешь её, чтоб остались только новые ноды, когда старые ноды умирают, все поды рекриейтятся полностью(без блу грин), как следствие ловлю даунтайм, так как нжинксы переподымаются, а ELB логично рапартует что ноды OutOfService так как хелсчек не могут пройти, через какое-то время всё возобновляется
можно это как-то обойти всё же? или с этим так и живут?
а ноды кто дропает? если cluster-autoscaler , то он перед этим эвакуирует поды из ноды. Тут конечно нужен pod distribution budget для надежности
А если у тебя ноды просто дропаются сторонней тулзой, то k8s об этом ничего не знает, соотвественно pod distribution budget тут не поможет, его как минимум надо комибинировать с pod anti affinity. Хотя это тоже может не спасти, если например дропнули три ноды, и все реплики приложения были на них.