Size: a a a

Церковь метрик

2020 May 25

G

Gabriel in Церковь метрик
Дмитрий Стародубцев
Сделал так, но не уверен что это лучший вариант:
 routes:
   - receiver: send_email
     match:
       alertname: service_down

   - receiver: send_email
     match:
       alertname: InstanceDown
Добавляйте нужный label и делайте маршрутизацию на его основе.
 https://prometheus.io/docs/prometheus/latest/configuration/alerting_rules/
источник

ДС

Дмитрий Стародубцев... in Церковь метрик
Gabriel
Добавляйте нужный label и делайте маршрутизацию на его основе.
 https://prometheus.io/docs/prometheus/latest/configuration/alerting_rules/
Спасибо
источник

GR

Gregory Rybalka in Церковь метрик
ребят а есть такой же канал только по логам....?
источник

Г

Гайрат in Церковь метрик
источник

VL

Vethopheth Lephanim in Церковь метрик
источник

GR

Gregory Rybalka in Церковь метрик
спасибо!
источник

AS

Aleksey Shirokikh in Церковь метрик
dmitry
ребят, есть крон, который шлет в statsd следующие метрики:
25 May 09:28:00 - cron-run.start:1|g
25 May 09:28:16 - cron-run.stop:1|g
25 May 09:28:16 - cron-run.success:1|g
25 May 09:28:16 - cron-run.duration:16883|ms|@0.1

statsd репитит метрики в statsd-exporter. в экспортер каждые 15 секунд приходит прометеус и забирает их.
как заставить statsd/statsd-exporter сбрасывать метрику в ноль после того, как крон закончился?
а то получается, что в графике каждые 15 секунд и старт и стоп и саксесс идут как 1, хотя крон завершил свою работу
заменть start и stop на status. где один это running а 0 stopped
источник

AS

Aleksey Shirokikh in Церковь метрик
Дмитрий Стародубцев
А вот ещё такой вопрос. Если я хочу в alertmanager.yml в routes привязать два алерта к одному ресиверу, как это можно сделать?
Вариант:
 routes:
   - receiver: send_email
     match:
       alertname:['service_down',' InstanceDown']

не работает.

В интернете не нашёл таких примеров. Так вообще делают?
читайте про match_re
источник

d

dmitry in Церковь метрик
Aleksey Shirokikh
заменть start и stop на status. где один это running а 0 stopped
да тут вшито https://github.com/gjcarneiro/yacron/blob/6a831afe97628a57a1c6a1235dac6338a5db24cd/yacron/statsd.py

только переписывать, выходит
источник

AS

Aleksey Shirokikh in Церковь метрик
так и есть
источник

AS

Aleksey Shirokikh in Церковь метрик
Gabriel
Добавляйте нужный label и делайте маршрутизацию на его основе.
 https://prometheus.io/docs/prometheus/latest/configuration/alerting_rules/
да так лучше и правда
источник

d

dmitry in Церковь метрик
Aleksey Shirokikh
так и есть
т.е. функционал statsd со сбрасыванием значения gauge в 0, если метрика неактивна, здесь мимо?
источник

AS

Aleksey Shirokikh in Церковь метрик
у вас диапазон допустимых значний 0 или 1
источник

AS

Aleksey Shirokikh in Церковь метрик
о каком сбросе вы говорите ?
источник

AS

Aleksey Shirokikh in Церковь метрик
в целом посмотрел на проект и не понял зачем он
источник

AS

Aleksey Shirokikh in Церковь метрик
если можно курлом в начале таски сбросить что мы начали
источник

AS

Aleksey Shirokikh in Церковь метрик
и вконце таски сбросить exit_code
источник

d

dmitry in Церковь метрик
тоже верно
источник

AS

Aleksey Shirokikh in Церковь метрик
докер контейнер с джобой оформить так
command: sleep <interval>; my_command
restart always
источник

AS

Aleksey Shirokikh in Церковь метрик
в 9 из 10 случаев должно быть достаточно
источник