Size: a a a

Церковь метрик

2020 May 18

AZ

Alexander Zobnin in Церковь метрик
Если проблема в количестве. Выглядит как экономия на спичках, конечно.
источник

SP

Sergei Puzyrev in Церковь метрик
Donald Fauntleroy
кстати, вот эти ваши экспортеры самодельные насколько надежны? не текут? не вылетают с экспшнами когда им прилетает чото не по уставу от сервиса?
как ваши скрипты самодельные? не падают? не срут в stderr? не умирают, когда к ним SIGTERM прилетает от родителя?
источник

SP

Sergei Puzyrev in Церковь метрик
как напишешь - так и будут работать, камон
источник

DF

Donald Fauntleroy in Церковь метрик
у одноразовых скриптов есть тот плюс, что они все равно умрут в конце выполнения, это совсем другие требования к надежности
источник
2020 May 19

L

Lev in Церковь метрик
Так пром сможет сказать в алертилку когда up != 1. По моему опыту - вероятность падения сервиса(любого) равна 1(100%). Нет смысла пытаться обеспечить надежность одного сервиса когда можно подпереть костыликом и перезапускать когда сломается, сделать копию сервиса, запилить failover между ними etc. Если присмотреться - в IT сотни подобных механизмов начиная с самых нижних уровней. Иными словами - все "умные" устройства, которые нас окружают, работают только благодаря огромному множеству костылей и подпорок разной степени извращенности
источник

DB

Dmitry Bubnov in Церковь метрик
Привет!
Кто-то сталкивался в Prometheus с invalid UTF-8 label value ? Как победить?
источник

GM

Gleb Mekhrenin in Церковь метрик
логи почитать
источник

DB

Dmitry Bubnov in Церковь метрик
Я понимаю, что от экспортера прилетает что-то на русском, скорее всего. Как я могу игнорировать или переименовать конкретное место в метрике? То есть даже как его опознать?
источник

SC

Sun Cheez in Церковь метрик
Парни, а расскажите, плз, как запросить 5-минутные статы за сутки назад?
Например, мне надо сравнить 1 - avg(irate(node_cpu_seconds_total{instance=~"$instance",mode="idle"}[5m])) by (instance) и то же самое, но суточной давности.
источник

SC

Sun Cheez in Церковь метрик
Я пытаюсь не алертить на нагрузку во время регулярных мощных нагрузок.
источник

GM

Gleb Mekhrenin in Церковь метрик
Dmitry Bubnov
Я понимаю, что от экспортера прилетает что-то на русском, скорее всего. Как я могу игнорировать или переименовать конкретное место в метрике? То есть даже как его опознать?
с опознанием не подскажу, а так в теории релейбл есть, но хз не сломается ли он на русском языке
источник

DS

Dmitry Sergeev in Церковь метрик
Denys 💛📈 💫 Zhdanov
Трансформейшенами. Идея на поверхности конечно и надо ещё реализацию полировать, но идея хорошая
Офигеть, действительно крутая фича!
А там случайно не завезли возможность закреплять панель с переменными (вверху), чтобы при прокрутке экрана дашборда вниз она не пропадала?
источник

W

Womchik in Церковь метрик
Sun Cheez
Парни, а расскажите, плз, как запросить 5-минутные статы за сутки назад?
Например, мне надо сравнить 1 - avg(irate(node_cpu_seconds_total{instance=~"$instance",mode="idle"}[5m])) by (instance) и то же самое, но суточной давности.
offset 1d
источник

SC

Sun Cheez in Церковь метрик
Womchik
offset 1d
Вот-такенное спасибо
источник

S

Slach in Церковь метрик
всем привет
как сделать вот такое выражение в prometheus alert rules ?

sum(rate(myserver_mertric_Uptime[3m])) by (hostname) > 1 and < 300

мне надо алертить если аптайм по hostname не нулевой и алертить первые 5 минут
источник

S

Slach in Церковь метрик
два раза sum() by ()  через and делать?
и считать тоже будет два раза?
источник

VL

Vethopheth Lephanim in Церковь метрик
sum(rate(myserver_mertric_Uptime[3m])) by (hostname) > 1 < 300
ы?
источник

S

Slach in Церковь метрик
Vethopheth Lephanim
sum(rate(myserver_mertric_Uptime[3m])) by (hostname) > 1 < 300
ы?
а так точно будет работать?
я просто читаю
https://prometheus.io/docs/prometheus/latest/querying/operators/
и
https://prometheus.io/docs/prometheus/latest/configuration/alerting_rules/
и как то там не сказано что можно оператор (> и < это же операторы в терминах prometheus) два раза применять
источник

VL

Vethopheth Lephanim in Церковь метрик
Vethopheth Lephanim
в конец добавить < +Inf
ну у меня вот так работает
источник

VL

Vethopheth Lephanim in Церковь метрик
на счёт "мне надо алертить если аптайм по hostname не нулевой и алертить первые 5 минут" не уверен, но точно будет срабатывать в случае, если значение myserver_mertric_Uptime между единицей и любимым числом тракториста
источник