Size: a a a

2019 December 16

А

Анастасия in DevOps
спасибо
источник

D

Denis 災 nobody in DevOps
а кто consul использует?
источник

IE

Ivan EKbfh in DevOps
Анастасия
спасибо
Раздвоение лчности, да?
источник

k

kSandr in DevOps
Denis 災 nobody
а кто consul использует?
лучше спроси кто его неиспользует
источник

D

Denis 災 nobody in DevOps
оно ставится из пакетов?
источник

D

Denis 災 nobody in DevOps
на офсайте архивчиком
источник

k

kSandr in DevOps
Denis 災 nobody
оно ставится из пакетов?
как хочешь так и ставь, хоть вгетом скачивай, хоть контейнером, хоть пакетом
источник

D

Denis 災 nobody in DevOps
говорят, консул сам умеет смотреть на амазон теги и рулить своим кластером... делал кто?
источник

D

Denis 災 nobody in DevOps
выдать ему только прав на чтение тегов
источник

D

Denis 災 nobody in DevOps
источник

D

Denis 災 nobody in DevOps
видимо оно
источник

A

Andrey in DevOps
всем привет, обновил графану до последней версии 6.5.2 и сломались алерты, в логах висит
lvl=info msg="New state change" logger=alerting.resultHandler ruleId=5 newState=ok prev state=pending

но ничего не приходит, если проверить через тестовую отправку, то сообщения приходят, в чем может быть проблема?
источник

A

Andrey in DevOps
источник

b

bama^boy in DevOps
Andrey
всем привет, обновил графану до последней версии 6.5.2 и сломались алерты, в логах висит
lvl=info msg="New state change" logger=alerting.resultHandler ruleId=5 newState=ok prev state=pending

но ничего не приходит, если проверить через тестовую отправку, то сообщения приходят, в чем может быть проблема?
включи дебаг логи, может, будет больше инфы
источник

A

Andrey in DevOps
bama^boy
включи дебаг логи, может, будет больше инфы
смотрел дебаг, ничего особенного не пишет
t=2019-12-16T16:07:30+0000 lvl=dbug msg="Scheduling update" logger=alerting.scheduler ruleCount=2
t=2019-12-16T16:07:30+0000 lvl=dbug msg="Scheduler: Putting job on to exec queue" logger=alerting.scheduler name="Name metrics" id=5
t=2019-12-16T16:07:30+0000 lvl=dbug msg="Sending query" logger=tsdb.prometheus start=2019-12-16T16:06:30+0000 end=2019-12-16T16:07:30+0000 step=30s query="sum(irate(pg_stat_database_tup_returned{datname=~\"db\",instance=~\"db\"}[5m]))"
t=2019-12-16T16:07:30+0000 lvl=dbug msg="Job Execution completed" logger=alerting.engine timeMs=4.284 alertId=5 name="Name metrics" firing=true attemptID=1
t=2019-12-16T16:07:40+0000 lvl=dbug msg="Scheduling update" logger=alerting.scheduler ruleCount=2
t=2019-12-16T16:07:50+0000 lvl=dbug msg="Scheduling update" logger=alerting.scheduler ruleCount=2
t=2019-12-16T16:08:00+0000 lvl=dbug msg="Scheduling update" logger=alerting.scheduler ruleCount=2
источник

b

bama^boy in DevOps
Andrey
смотрел дебаг, ничего особенного не пишет
t=2019-12-16T16:07:30+0000 lvl=dbug msg="Scheduling update" logger=alerting.scheduler ruleCount=2
t=2019-12-16T16:07:30+0000 lvl=dbug msg="Scheduler: Putting job on to exec queue" logger=alerting.scheduler name="Name metrics" id=5
t=2019-12-16T16:07:30+0000 lvl=dbug msg="Sending query" logger=tsdb.prometheus start=2019-12-16T16:06:30+0000 end=2019-12-16T16:07:30+0000 step=30s query="sum(irate(pg_stat_database_tup_returned{datname=~\"db\",instance=~\"db\"}[5m]))"
t=2019-12-16T16:07:30+0000 lvl=dbug msg="Job Execution completed" logger=alerting.engine timeMs=4.284 alertId=5 name="Name metrics" firing=true attemptID=1
t=2019-12-16T16:07:40+0000 lvl=dbug msg="Scheduling update" logger=alerting.scheduler ruleCount=2
t=2019-12-16T16:07:50+0000 lvl=dbug msg="Scheduling update" logger=alerting.scheduler ruleCount=2
t=2019-12-16T16:08:00+0000 lvl=dbug msg="Scheduling update" logger=alerting.scheduler ruleCount=2
а почему не использовать стандартный алертинг от прома?
источник

b

bama^boy in DevOps
не то, чтобы это решит проблему с графаной, просто интересно
источник

A

Andrey in DevOps
bama^boy
не то, чтобы это решит проблему с графаной, просто интересно
быстро надо было настроить алерты и настроил через графана и пока так и осталось, пока вот не решили обновиться
источник

b

bama^boy in DevOps
Andrey
быстро надо было настроить алерты и настроил через графана и пока так и осталось, пока вот не решили обновиться
вероятно, что графана проверяет метрику какое-то время (там настраивается evaluate every N  for N), а метрика флапает и никогда не бывает больше порога за эти N минут/секунд
источник

b

bama^boy in DevOps
в логах же нет sending alert
источник