Господа, привет! Прошу помощи.
У нас в кубе на 8 цпу начал лагать rabbitmq на 100к+ сообщений. А именно таймаутятся readines пробы -
rabbitmq-diagnostics -q check_local_alarms
через 20с. Я полез в графану (в том же кубе) и увидел, что прометеус стэк создал и всегда держит 200 процессов, а в пике около 400. Сам рэббит по ресурсам себя комфортно чувствует - цпу у него не растет выше 50%, память тоже
Не могу связать большое количество сообщений и замедление работы пода рэббита. Но предполагаю, что сервис с метрикой спавнит слишком много процессов и из-за этого на рэббит переключение исполнения происходит редко. Судя по тому, как лагает под рэббита, так и есть
Смотрю на вот эту метрику:
container_processes{endpoint="https-metrics", id="/", instance="x", job="kubelet", metrics_path="/metrics/cadvisor", node="x", service="kube-prometheus-stack-kubelet"}
Ставим прометеус мы вот так
https://pastebin.com/gzJLz1h4Сталкивались ли с такой проблемой? Или, мб посоветуете какой-то проверенный способ с прометеусом в кубе?