Size: a a a

2020 February 05

LB

Let Eat Bee in DevOps
Vladimir Smirnov
обсуждают, обсуждают. А если ты знаешь что на 2 входных эвента должно приходится три выходных, то ты же можешь рассчитать сколько ты должен выплюнуть во вне и смотреть разницу прогноза с реальностью?
Может там от данных зависит. Где будет три, а где 1. Но идея как я понял считать за SLI сколько рестеряли по дороге?
источник

VS

Vladimir Smirnov in DevOps
как один из вариантов, почему бы нет?
источник

VS

Vladimir Smirnov in DevOps
если у тебя есть идея сколько должно быть на выходе
источник

LB

Let Eat Bee in DevOps
Ну к "сколько" надо б ещё и "вовремя" , а с этим ещё сложнее
источник

VS

Vladimir Smirnov in DevOps
вопрос в общем в том, что за сервис и что вам важно от него...
источник

ЕО

Евгений Омельченко in DevOps
Let Eat Bee
Ну к "сколько" надо б ещё и "вовремя" , а с этим ещё сложнее
Тебе интересно что мерять всё-таки или как?
источник

NK

Nick Kritsky in DevOps
Let Eat Bee
про SRE обсуждают тут? Кто-нибудь видел/знает пример   SLI для штук работающих на очередях. Прочитали два евента, положили три в другую очередь.
Я бы скорее использовал количество подвисших сообщений возрастом старше N во входной очереди. Это показывает - успеваем ли мы обработать.
источник

NK

Nick Kritsky in DevOps
Для некоторых приложений - сравнивать timestamp на входящем и исходящем сообщении - если мы бьёмся за скорость обработки.
источник

ЕО

Евгений Омельченко in DevOps
Let Eat Bee
Ну к "сколько" надо б ещё и "вовремя" , а с этим ещё сложнее
Летенси проще мерять чем правильность количества ответов. Просто меряешь интервал между началом и окончанием обработчика
источник

NK

Nick Kritsky in DevOps
Врианта one-size-fits-all не могу придумать - всё зависит от brd
источник

NK

Nick Kritsky in DevOps
Евгений Омельченко
Летенси проще мерять чем правильность количества ответов. Просто меряешь интервал между началом и окончанием обработчика
+
источник

C

Combot in DevOps
Nick Kritsky (0) увеличил репутацию Евгений Омельченко (14.47) (+0.86)
источник

LB

Let Eat Bee in DevOps
Евгений Омельченко
Тебе интересно что мерять всё-таки или как?
Что. Но из ответа на "что?" тоже не всегда понятно как сделать :)
источник

LB

Let Eat Bee in DevOps
Vladimir Smirnov
вопрос в общем в том, что за сервис и что вам важно от него...
Тут у них пятнадцать сервисов и все друг с другом через Кафку, апи вызовов вообще нет :) я такого ещё не видел.
источник

ЕО

Евгений Омельченко in DevOps
Let Eat Bee
Что. Но из ответа на "что?" тоже не всегда понятно как сделать :)
Ну, на самом деле, ответить что мерять невозможно. У разных приложений разная норма (например для бекенда и аналитического приложения совсем разные метрики важны)
источник

LB

Let Eat Bee in DevOps
Ну я у них спрашиваю, что расстроит ваших "клиентов" :) часто  примерно понимают , но сформулировать не могут. Рассуждения вообще про качество данных (свежесть ,корректность , непротиворечивость), такое вообще хз как мерить :)  вот и спросил, может кто обвешивал SLI  всякие ETL и прочую асинхронщину, может по граблям прошлись уже
источник

ЕО

Евгений Омельченко in DevOps
Let Eat Bee
Тут у них пятнадцать сервисов и все друг с другом через Кафку, апи вызовов вообще нет :) я такого ещё не видел.
Напрашивается дистрибьютед трейсинг для начала
источник

LB

Let Eat Bee in DevOps
Евгений Омельченко
Напрашивается дистрибьютед трейсинг для начала
по трейсинг даёт понять что внутри трейса происходило, оно не очень для собирания статистики по трейсам. Да и как реализовывать непонятно, оно опять же на запрос-ответ рассчитано . Скажем пришло два сообщение с traceId: X и Y. Одно получили, отложили до лучших времён, получили второе, смержили данные положили в другую исходящую очередь . Какой traceId использовать в исходящем сообщении?
источник

ЕО

Евгений Омельченко in DevOps
Let Eat Bee
Ну я у них спрашиваю, что расстроит ваших "клиентов" :) часто  примерно понимают , но сформулировать не могут. Рассуждения вообще про качество данных (свежесть ,корректность , непротиворечивость), такое вообще хз как мерить :)  вот и спросил, может кто обвешивал SLI  всякие ETL и прочую асинхронщину, может по граблям прошлись уже
SLI на консистентность данных это интересно, никогда не слышал, чтобы кто-то такое мерял. Но умозрительно кажется, что это можно посчитать с помощью достаточно хорошо обогащённого дистрибьютед трейсинга
источник

Р

Рашит in DevOps
У Gwen Shapira есть выступление про то, что и как мониторить в Кафке, можно оттуда SLI посмотреть
источник