Chaos Engineering основан на манифесте
Principles of Chaos Engineering для поиска узких мест в боевой инфраструктуре и дальнейшем устранение ботл неков. Методы проведения тестов достаточно "жестоки", а именно во время тестов, могут выключаться или удаляться разные ноды/поды/сервисы или в целом удалятся целые сегменты инфраструктуры (например, если у вас AWS, может произойти удаление VPC или сброс всех маршрутов), могут появляться сетевые задержки или формироваться сетевые шторма. Подготовка к работам требует хорошее знание как архитектуры инфраструктуры, так и приложения для минимизации радиуса поражения дабы не аффектить клиентов. Все тесты программируются через набор инструментов которые легко автоматизируются:
- chaos toolkit
- chaos monkey
- pumba
Как-то так🤔