Size: a a a

Церковь метрик

2021 June 22

IE

Ivan EKbfh in Церковь метрик
привет!
Я правильно понял, что посчитать среднее или квантиль в проме за большой интервал только руками?

    sum(sum_over_time(my_metric[7d]))
/
   sum(count_over_time(my_metric[7d]))
источник

IE

Ivan EKbfh in Церковь метрик
потому что avg_over_time мне range выдаёт со всеми точками, а мне оно не нужно
источник

AS

Aleksey Shirokikh in Церковь метрик
avg_over_time(sum(my_metric[7d])) ?
источник

IE

Ivan EKbfh in Церковь метрик
Интересно, тогда sum by ()
источник

IE

Ivan EKbfh in Церковь метрик
Спасибо
источник

AV

Aliaksandr Valialkin in Церковь метрик
такое будет работать не так, как ожидается в большинстве случаев - см. https://www.robustperception.io/rate-then-sum-never-sum-then-rate
источник

AV

Aliaksandr Valialkin in Церковь метрик
см. сообщение выше ^
источник

AS

Aleksey Shirokikh in Церковь метрик
да в зависитимости от типа может быть другое
источник

AV

Aliaksandr Valialkin in Церковь метрик
для среднего - да. Квантиль поверх нескольких рядов вида gauge вообще в проме нельзя подсчитать. В вм можно с помощью чего-то вроде histogram_quantile(phi, sum(histogram_over_time(my_metric[7d]))) by (vmrange))
источник

AS

Aleksey Shirokikh in Церковь метрик
вот такое у меня получилось для вычисления sli сети
avg_over_time((max(probe_success{job="network-probe"}) without (instance))[5m:])
источник

AS

Aleksey Shirokikh in Церковь метрик
но probe_success это gauge
источник

IE

Ivan EKbfh in Церковь метрик
Мне достаточно грубой прикидки, поэтому для over_time делаю [7d:12h], хватает
источник
2021 June 23

C

Combot in Церковь метрик
ibtoey mnapt has been banned! Reason: CAS ban.
источник

J

John Roe in Церковь метрик
ibtoey mnapt: user has been CAS banned
источник

S

Slach in Церковь метрик
Всем привет, а есть тут те кто мониторит через prometheus zookeeper?
там есть две метрики
response_packet_cache_hits
и
response_packet_cache_misses

решили померять hit rate для них
в некоторых инстансах hit rate 3% всего

есть настройка maxResponseCacheSize
стоит ли ее менять?
источник

S

Solresl in Церковь метрик
Приветствую.

Подскажите, как кто поступает?

Есть несколько независимых кластеров куба.
В одном из них крутится основная Виктория.
Необходимо данные отовсюду собирать и алертиьь в случае чего.

Есть вроде стек kube-prometheus  со всеми конфигами чтобы мониторить куб. Если использовать его и собирать в Центральную ВМ, то получается теряется разбивка по кластерам в дашбордах и правилах.
Можно править правила и дашборды, но это изменения, которые придётся делать каждый раз при обновление стека kube-prometheus.

У всех свои правила написаны или кто-то уже решил  за меня эту проблему?
источник

AN

Artem Navoiev in Церковь метрик
а почему теряется разбивка по кластерам? лейблы нет?
источник

S

Solresl in Церковь метрик
Да, насколько вижу в алертах много где нет разбивки дополнительной. Лишь name space, service и т. Д

У меня не последняя версия, но бегло и в последних так.
источник

SB

Stanislav Buldakov in Церковь метрик
Как я понял, kube-prometheus направлен на внутренний мониторинг кластера. Внешние таргеты и рулы цеплять можно, но очень больно 😫
источник

SM

Sergei Mikhaltsov in Церковь метрик
господа,  я вам вопрс прнс по прометею. Можно ли прометею сказать, чтоб он в лейблы алерта пихал инфу о себе, дабы я понимал какой из прометеев стриггерил алерт?
источник