Size: a a a

Церковь метрик

2021 January 25

SC

Smoked Cheese in Церковь метрик
(sum by (server) (rate(haproxy_server_http_responses_total{code="5xx"}[1m]))) / on () (sum(rate(haproxy_server_http_responses_total[1m]))*100)
источник

ДУ

Денис Устинов... in Церковь метрик
Error executing query: multiple matches for labels: many-to-one matching must be explicit (group_left/group_right)
источник

SC

Smoked Cheese in Церковь метрик
а, я соврал
источник

SC

Smoked Cheese in Церковь метрик
там by ()
источник

SC

Smoked Cheese in Церковь метрик
(sum by (server) (rate(haproxy_server_http_responses_total{code="5xx"}[1m]))) / by () (sum(rate(haproxy_server_http_responses_total[1m]))*100)
источник

SC

Smoked Cheese in Церковь метрик
можно ещё попробовать / without (server)
источник

SC

Smoked Cheese in Церковь метрик
или я опять ошибся
источник

SC

Smoked Cheese in Церковь метрик
так
источник

SC

Smoked Cheese in Церковь метрик
источник

SC

Smoked Cheese in Церковь метрик
sum by (instance) (rate(node_cpu_seconds_total[1m])) / on () group_left() sum(rate(node_cpu_seconds_total[1m]))
источник

ДУ

Денис Устинов... in Церковь метрик
оо, получилось
источник

ДУ

Денис Устинов... in Церковь метрик
почему-то думал, что many-to-one как-то попроще делается
источник

В

Вадим in Церковь метрик
Всем привет!
коллеги поделитесь толковым графиком по http latency - метрик полно а толкового графика нет для понимания что с сервисом
источник

S

Slach in Церковь метрик
Вадим
Всем привет!
коллеги поделитесь толковым графиком по http latency - метрик полно а толкового графика нет для понимания что с сервисом
почитайте что такое apdex и как он считается
в целом про latency хватает динамики 50% и 90% персентиля
источник

В

Вадим in Церковь метрик
да эти метрики у меня есть - есть и гистограмма и саммари
на какой-то конфе смотрел люди делали сложный график и с каким-то средним и с 2мя тройными девиациями вверх и вниз для алертига

сами q50 b q90 особенно не дают понимания - видим различные группы но общей картины нет
источник

S

Slach in Церковь метрик
Вадим
да эти метрики у меня есть - есть и гистограмма и саммари
на какой-то конфе смотрел люди делали сложный график и с каким-то средним и с 2мя тройными девиациями вверх и вниз для алертига

сами q50 b q90 особенно не дают понимания - видим различные группы но общей картины нет
общей картины чего?
если у вас q90 существенно больше чем q50, и при этом скачет, и значения q90 для вашей конкретной тематики неприемлимы (выходят за трешхолд) то явно надо разбираться что там внутри этой латенси и что тормозит...(делать drilldown какой нибудь где все аспекты уже и подробные графики как по группам URL (сервисам)
так и по составляющим конкретной URL
источник

В

Вадим in Церковь метрик
Slach
общей картины чего?
если у вас q90 существенно больше чем q50, и при этом скачет, и значения q90 для вашей конкретной тематики неприемлимы (выходят за трешхолд) то явно надо разбираться что там внутри этой латенси и что тормозит...(делать drilldown какой нибудь где все аспекты уже и подробные графики как по группам URL (сервисам)
так и по составляющим конкретной URL
в любом нагруженном сервисе q90 существенно больше q50 (по крайней мере для node.js) в силу занятости event-loop - это нормально
не видно где сейчас находится основная масса запросов куда мигрирует каковы тенденции - отдельно по группам видим а в общем - нет
источник

S

Slach in Церковь метрик
Вадим
в любом нагруженном сервисе q90 существенно больше q50 (по крайней мере для node.js) в силу занятости event-loop - это нормально
не видно где сейчас находится основная масса запросов куда мигрирует каковы тенденции - отдельно по группам видим а в общем - нет
ну сделайте q75
и основная масса запросов попадет туда...
источник

S

Slach in Церковь метрик
Вадим
в любом нагруженном сервисе q90 существенно больше q50 (по крайней мере для node.js) в силу занятости event-loop - это нормально
не видно где сейчас находится основная масса запросов куда мигрирует каковы тенденции - отдельно по группам видим а в общем - нет
IMHO вы что-то не понимаете =)
IMHO q90 существенно больше q50 только если у вас низкие требования к latency

евентлуп не загружен, он как раз придуман для того чтобы узким местом не являться, а передавать concurency на уровень backend storage systems (которые обычно СУБД или внешние API)
источник

В

Вадим in Церковь метрик
Slach
ну сделайте q75
и основная масса запросов попадет туда...
Ну это же не совсем так - это говорит о том что 75% запросов укладываютс во столько-то миллисекунд но внутри этого интервала они могут быть размазаны и неоавномерно и основная струя может меняться и двигаться а мы жтого не увидим - мы видим только потолок
источник