Size: a a a

Церковь метрик

2021 December 01

AV

Aliaksandr Valialkin in Церковь метрик
Попробуйте завернуть делитель в sum(), чтобы убрать лишние лейблы, котлрые мешают выполнению деления. См. https://prometheus.io/docs/prometheus/latest/querying/operators/#vector-matching
источник

M

Maksimus Ulibikus in Церковь метрик
Коллеги, нигде не могу найти в исходниках postgres_exporter, какой запрос выпоняет метрика pg_replication_is_replica. Эта метрика у меня ни на одном сервере с Postgres не появляется.
источник

MZ

Mike Zorch in Церковь метрик
Вопрос по использованию в Проме функции absent. Функция режет лейблы, которые я хочу пробрасывать в текст алерта. absent by (...) - не работает. Есть какие-то обходные варианты?
источник

A

Andor in Церковь метрик
эта функция устанавливает отсутствие метрики с указанными лейблами
источник

A

Andor in Церковь метрик
если метрики нет, то какие лейблы ей возвращать?
источник

MZ

Mike Zorch in Церковь метрик
которые в условии функции
источник

MZ

Mike Zorch in Церковь метрик
К примеру

absent(container_last_seen{image!~".*cadvisor.*|.*node[_-]exporter.*|^.{0}$"})

я хочу получить в описании алерта имя контейнера. возможно ли это?
источник

ДУ

Денис Устинов... in Церковь метрик
если хотя бы один из списка будет, то выражение вернёт ложь
источник

MZ

Mike Zorch in Церковь метрик
имя конейнера в результате всё равно не получить
источник

ДУ

Денис Устинов... in Церковь метрик
отдельный алерт на каждый имаж
источник

ДУ

Денис Устинов... in Церковь метрик
алерты темплейтить
источник

MZ

Mike Zorch in Церковь метрик
ясно. я хотел сделать просто универсальный алерт для всех джобов\ландшафтов\хостов итд
источник

V

Vitaly in Церковь метрик
Спасибо! действительно, похоже, что точка в 18:00 при степе=1h соответствует интервалу данных за 17:00-18:00, а не за 18:00-19:00 как могло показаться (мне). Оффсет действительно помогает, но только надо негативный offset, включив его в фича флагах: offset $__interval (или offset -1h)
источник

MZ

Mike Zorch in Церковь метрик
Ещё вопрос по Прому\Алертменеджеру.
Я наблюдаю странное поведение алертов.

Появляется аварийное событие - алерт появляется в Проме и Алертменеджере и соответственно прилетает в интеграцию.
Через 5 минут алерт пропадает в проме и алертменеджере (хотя аварийная ситуация сохраняется).
Заодно у меня настроена интеграция (с Opsgenie) и при "пропаже" алерта закрывается тикет и тут же открывается новый.
Но вопрос именно в том, почему у меня пропадает алерт в проме\алертменеджере.
5 минут меня насторожило и я выставил
resolve_timeout: 1d
Однако на ситуацию это никак не повлияло.
источник

AT

Aleksey Tvalavadze in Церковь метрик
value в лейбле не прописан?
источник

MZ

Mike Zorch in Церковь метрик
нет
источник

AT

Aleksey Tvalavadze in Церковь метрик
а у метрики по которой создается алерт не больше 5 минут интервал обновления?
источник

MZ

Mike Zorch in Церковь метрик
нет, меньше
источник

MZ

Mike Zorch in Церковь метрик
я использую глобальные настройки, если это поможет для разбора

 scrape_interval: 1m
 scrape_timeout: 20s
 evaluation_interval: 30s

для exp
for: 1m обычно
источник

AT

Aleksey Tvalavadze in Церковь метрик
а алерт пришли
источник