Телеграмм чат группы metrics_ru страница 6740

parrot.ru

Рейтинг популярных групп и каналов

В рейтинге участвует:

групп:

каналов:

Виртуальный сервер на SSD - недорого!

Аренда выделенных и виртуальных серверов (VDS/VPS), хостинг, аренда IP-адресов, администрирование, круглосуточная поддержка

qwarta.ru подробнее

Резервное копирование с проверкой на вирусы!!!

Удобный сервис создания резервных копий на любой сервер сети интернет. Отслеживайте изменения, проверяйте на вирусы. Надежно защитите свой бизнес!

go.backupland.com

Выбираете сервер? Любая конфигурация на заказ!

Аренда физических серверов любых конфигураций под любые запросы - 1С бухгалтерия, игровые сервера, нагруженные проекты, интернет-магазины!

qwarta.ru подробнее

Size: a a a

Церковь метрик

2761 membersпожаловаться на группу

2021 January 25

S

Slach in Церковь метрик

Вадим

Ну это же не совсем так - это говорит о том что 75% запросов укладываютс во столько-то миллисекунд но внутри этого интервала они могут быть размазаны и неоавномерно и основная струя может меняться и двигаться а мы жтого не увидим - мы видим только потолок

ну ок.
тогда смотрите
обычно я персентили не считаю
обычно я делю latency на несколько бакетов и задаю этим бакетам границы исходя из требования к сервису
а дальше рисую stacked диаграмму по кол-ву запросов в каждом бакете за единицу времени
и зеленым\синим отображаю "безопасные" бакеты, а "желтым" и "красным" - "опасные"

обычно значения 0-0.2sec, 0.2-0.5sec, 0.5-2sec, 2+sec
но для ваших сервисов требования могут быть другие

источник

19:46пожаловаться #1

В

Вадим in Церковь метрик

IMHO вы что-то не понимаете =)
IMHO q90 существенно больше q50 только если у вас низкие требования к latency

евентлуп не загружен, он как раз придуман для того чтобы узким местом не являться, а передавать concurency на уровень backend storage systems (которые обычно СУБД или внешние API)

Ну похоже вы не верно понимаете event-loop - когда сервис отправил тысячи запросов в апи и занялся вычислительной работой - тысячи запросов аисят и время тикает пока не разгрузится основной поток и лишь после этого он начнет разгребать завалы с пришедшими ответами апи но тут навалят новыз запросов и основной поток опять загружен но не все пришедшие от апи ответы будут обработаны - вот они то и попадают в 90е перцентили

источник

19:46пожаловаться #2

S

Slach in Церковь метрик

но это требует по другому агрегировать latency где нибудь в statsd через hystogram

источник

19:47пожаловаться #3

S

Slach in Церковь метрик

Вадим

Ну похоже вы не верно понимаете event-loop - когда сервис отправил тысячи запросов в апи и занялся вычислительной работой - тысячи запросов аисят и время тикает пока не разгрузится основной поток и лишь после этого он начнет разгребать завалы с пришедшими ответами апи но тут навалят новыз запросов и основной поток опять загружен но не все пришедшие от апи ответы будут обработаны - вот они то и попадают в 90е перцентили

я верно понимаю евентлуп
еще раз, евент луп сам по себе не узкое место
если вы зафигачили евентлуп а сами в нем занимаетесь бесконечно неээфективным парсингом здоровых JSON, то вы сами себе злобные буратины

источник

19:47пожаловаться #4

В

Вадим in Церковь метрик

я верно понимаю евентлуп
еще раз, евент луп сам по себе не узкое место
если вы зафигачили евентлуп а сами в нем занимаетесь бесконечно неээфективным парсингом здоровых JSON, то вы сами себе злобные буратины

Да нет я этим не занимаюсь - я не извращенец😊
И даже из бд json частично возвращаю строками чтоб меньше парсил сервис - просто большой объем запросов может прийти лавинообразно и как бы вы не оптимизировали код - event-loop будет перегружен

источник

19:50пожаловаться #5

S

Slach in Церковь метрик

Вадим

Ну похоже вы не верно понимаете event-loop - когда сервис отправил тысячи запросов в апи и занялся вычислительной работой - тысячи запросов аисят и время тикает пока не разгрузится основной поток и лишь после этого он начнет разгребать завалы с пришедшими ответами апи но тут навалят новыз запросов и основной поток опять загружен но не все пришедшие от апи ответы будут обработаны - вот они то и попадают в 90е перцентили

в общем CPU bound + async io, угу, такое себе
снижайте CPU bound
если у вас CPU Utilization близкое к 100%
анализ flamegraph вам в помощь
и SIMDJSON вам в помощь

источник

19:51пожаловаться #6

S

Slach in Церковь метрик

Вадим

Да нет я этим не занимаюсь - я не извращенец😊
И даже из бд json частично возвращаю строками чтоб меньше парсил сервис - просто большой объем запросов может прийти лавинообразно и как бы вы не оптимизировали код - event-loop будет перегружен

ну это я все забываю, что nodejs же однопоточный
ну вроде же там можно пул процессов запустить
разгребут если ядер хватит

источник

19:52пожаловаться #7

S

Slach in Церковь метрик

ладно в общем да, latency не всегда берется из IO ;)
ну про бакеты и гистограммы я надеюсь вы поняли

источник

19:53пожаловаться #8

В

Вадим in Церковь метрик

ладно в общем да, latency не всегда берется из IO ;)
ну про бакеты и гистограммы я надеюсь вы поняли

Да есть у меня и гистрограммы с бакетами 😊
Но они же по принципу квантилей работают - насыпают и во все нижестоящие бакеты - т.е. тот же потолок видим а не течение основной массы

источник

19:55пожаловаться #9

В

Вадим in Церковь метрик

источник

20:01пожаловаться #10

В

Вадим in Церковь метрик

вот пример и проц не нагружен и разница в квантилял большая q50 и q90
и что из этого можно понять? ровным счетом - ничего )
нет конечно я понимаю что тут апи тормозит но из графиков этого не понять

источник

20:01пожаловаться #11

S

Slach in Церковь метрик

Вадим

Да есть у меня и гистрограммы с бакетами 😊
Но они же по принципу квантилей работают - насыпают и во все нижестоящие бакеты - т.е. тот же потолок видим а не течение основной массы

ну покажите картинку с бакетами
если у вас есть нормальные требования к сервисам, то у вас есть трешхолды для бакетов
и по ним будет убывает ли "зеленая полоса"

источник

20:09пожаловаться #12

В

Вадим in Церковь метрик

мы видим потолки границ но где тусит основной поток запросов визуально мы не видим а на конфернции ребята показывали график где толпа запросов змеей извивалась по графику

источник

20:09пожаловаться #13

S

Solresl in Церковь метрик

А что вы хотите увидеть?) ну время ответа не из-за загрузки cpu в данном случае.

Может у вас 10 клиентов урл дергают и 2 из них медленные.
50 персентиль и есть по сути основная масса

источник

20:10пожаловаться #14

S

Slach in Церковь метрик

Вадим

вот пример и проц не нагружен и разница в квантилял большая q50 и q90
и что из этого можно понять? ровным счетом - ничего )
нет конечно я понимаю что тут апи тормозит но из графиков этого не понять

тут можно понять, что у вас есть всплески по CPU которые не коррелируют с latency
значит CPU хватает
в этой картинке не хватает графика RPS как минимум

и тут видно что да, у вас приличный разбег по персентилям

значит надо разбивать по группам запросов
например по URL

источник

20:11пожаловаться #15

В

Вадим in Церковь метрик

Solresl

А что вы хотите увидеть?) ну время ответа не из-за загрузки cpu в данном случае.

Может у вас 10 клиентов урл дергают и 2 из них медленные.
50 персентиль и есть по сути основная масса

да - основная масса ниже этой границы но где? мы не видим

источник

20:11пожаловаться #16

В

Вадим in Церковь метрик

тут можно понять, что у вас есть всплески по CPU которые не коррелируют с latency
значит CPU хватает
в этой картинке не хватает графика RPS как минимум

и тут видно что да, у вас приличный разбег по персентилям

значит надо разбивать по группам запросов
например по URL

это нагрузочное тестирование по корневому урлу

источник

20:11пожаловаться #17

В

Вадим in Церковь метрик

покажите хоть свои графики - может мне понятней станет

источник

20:12пожаловаться #18

В

Вадим in Церковь метрик

тут можно понять, что у вас есть всплески по CPU которые не коррелируют с latency
значит CPU хватает
в этой картинке не хватает графика RPS как минимум

и тут видно что да, у вас приличный разбег по персентилям

значит надо разбивать по группам запросов
например по URL

источник

20:12пожаловаться #19

S

Solresl in Церковь метрик

Вадим

да - основная масса ниже этой границы но где? мы не видим

Сделайте больше бакетов если считаете этой инфы вам мало.

Не понятно чего вы хотите добиться?

Heatmap сделайте

источник

20:12пожаловаться #20