Alexander Kildyakov
Вообщем если кто-то когда-то имел дело с computer science, то возможно вспомнит, что "полупроводниковый кристалл не является на 100% стабильным" грубо говоря есть вероятность, что 2+2 будет не равно 4... Если произвести нехитрые логические заключения, то можно прийти к выводу, что все системы надо бутить и иногда переустанавливать. Ну а в кубере, поды иногда надо перестартовывать, ну хотя бы раз в год. Про костыли понял, видимо лучшим является ломать ливнеспробы через годик (может даже месяц) после старта у всех ms.
а эта отмазка работает если кластер больше года работал и упал? Мол я тут не причем, это кристалы, процессор, баги