Телеграмм чат группы kubernetes_ru страница 14358

parrot.ru

Рейтинг популярных групп и каналов

В рейтинге участвует:

групп:

каналов:

Виртуальный сервер на SSD - недорого!

Аренда выделенных и виртуальных серверов (VDS/VPS), хостинг, аренда IP-адресов, администрирование, круглосуточная поддержка

qwarta.ru подробнее

Резервное копирование с проверкой на вирусы!!!

Удобный сервис создания резервных копий на любой сервер сети интернет. Отслеживайте изменения, проверяйте на вирусы. Надежно защитите свой бизнес!

go.backupland.com

Выбираете сервер? Любая конфигурация на заказ!

Аренда физических серверов любых конфигураций под любые запросы - 1С бухгалтерия, игровые сервера, нагруженные проекты, интернет-магазины!

qwarta.ru подробнее

Size: a a a

Kubernetes — русскоговорящее сообщество

5529 membersпожаловаться на группу

2020 October 28

ST

Sergey Trapeznikov in Kubernetes — русскоговорящее сообщество

может вопрос все же к церкви метрик, но может тут кто шарит, по какой формуле можно высчитать процент cpu util для пода, от его лимита?
Обычно все метрики пляшут от лимита хоста

источник

02:18пожаловаться #1

DS

Dmitry Sergeev in Kubernetes — русскоговорящее сообщество

Sergey Trapeznikov

может вопрос все же к церкви метрик, но может тут кто шарит, по какой формуле можно высчитать процент cpu util для пода, от его лимита?
Обычно все метрики пляшут от лимита хоста

у меня вроде есть, там просто. Как буду за компом скину

источник

02:21пожаловаться #2

ST

Sergey Trapeznikov in Kubernetes — русскоговорящее сообщество

у меня вроде есть, там просто. Как буду за компом скину

источник

02:21пожаловаться #3

TL

Timofey Larkin in Kubernetes — русскоговорящее сообщество

тебе может быть понадобится соединить логи разных подсистем и приложений, по разным признакам и полям в одном месте , накрутить визуализации на них, с аггрегацией, медианами, перцентлями и отдать всё это программисту, вот смотри такой был инцидент. Так вот, это делается в graylog за пять минут, для этого даже не надо создавать отдельный дашборд. Grafana и loki с их грепом даже рядом не стоят на мой взгляд. Да и тормозит там все, заливаешь 20K логов в секунду и приехали, невозможно использовать. Но может это мой такой негативный опыт, и надо ещё раз пробовать в новых версиях 🤷‍♂

Аггрегация и, тем более перцентили с медианами - это не про текстовые данные. Если кто-то превращает текстовое поле в числовую метрику и жалуется, что в каких-то системах это сложно, вопрос не к системе, а к подходу к сбору телеметрии приложения. А системе, которая делает это легко и просто минус в карму за продвижение плохих практик.

источник

02:21пожаловаться #4

DS

Dmitry Sergeev in Kubernetes — русскоговорящее сообщество

Аггрегация и, тем более перцентили с медианами - это не про текстовые данные. Если кто-то превращает текстовое поле в числовую метрику и жалуется, что в каких-то системах это сложно, вопрос не к системе, а к подходу к сбору телеметрии приложения. А системе, которая делает это легко и просто минус в карму за продвижение плохих практик.

телеметрия логи не отменяет. Есть системы которые дают отличный инструментарий для анализа логов, не вижу причин их не использовать. Можно например специально отправлять в логи, запросы которые выполнялись очень долго, для дальнейшего подробного исследования. Время запроса - числовое поле.

источник

02:25пожаловаться #5

TL

Timofey Larkin in Kubernetes — русскоговорящее сообщество

телеметрия логи не отменяет. Есть системы которые дают отличный инструментарий для анализа логов, не вижу причин их не использовать. Можно например специально отправлять в логи, запросы которые выполнялись очень долго, для дальнейшего подробного исследования. Время запроса - числовое поле.

Звучит как будто программеру впадлу задуматься, что именно он хочет логом сказать и он такой "насру-ка я здесь plaintext'ом и пускай sre сам потом из этого строит свои графики и разбирается". А можно было положить, скажем, длительность запроса в гистограмму, а не писать "http get /endpoint 503 (0.495s)"

источник

02:30пожаловаться #6

TL

Timofey Larkin in Kubernetes — русскоговорящее сообщество

Логи, имхо, то, что полезно прочитать глазами, а не разводить аналитику. Типа этот конкретный запрос зафейлился потому, что пришли такие-то невалидные данные, а ожидались такие.

источник

02:32пожаловаться #7

TL

Timofey Larkin in Kubernetes — русскоговорящее сообщество

А если их агрегировать, оцифровывать и графики строить, значит кто-то поленился заимплементить метрику

источник

02:33пожаловаться #8

DS

Dmitry Sergeev in Kubernetes — русскоговорящее сообщество

Звучит как будто программеру впадлу задуматься, что именно он хочет логом сказать и он такой "насру-ка я здесь plaintext'ом и пускай sre сам потом из этого строит свои графики и разбирается". А можно было положить, скажем, длительность запроса в гистограмму, а не писать "http get /endpoint 503 (0.495s)"

Еще раз, метрики - не отменяют логов. По гистограмме ты можешь понять, что какое-то количество запросов выполнялилось в определённом промежутке времени запроса. Но для дальнейшего исследования, тебе могут понадобиться подробности о таких запросах, аргументы, размер тела запроса, заголовки и другие данные, которые могут понять программисту, почему такой то запрос выполнялся долго.

источник

02:34пожаловаться #9

TL

Timofey Larkin in Kubernetes — русскоговорящее сообщество

Еще раз, метрики - не отменяют логов. По гистограмме ты можешь понять, что какое-то количество запросов выполнялилось в определённом промежутке времени запроса. Но для дальнейшего исследования, тебе могут понадобиться подробности о таких запросах, аргументы, размер тела запроса, заголовки и другие данные, которые могут понять программисту, почему такой то запрос выполнялся долго.

И когда ты по метрикам увидел, когда это произошло и в каком приложении, на кой черт тебе сдалась полнотекстовая индексация?

источник

02:36пожаловаться #10

DS

Dmitry Sergeev in Kubernetes — русскоговорящее сообщество

А если их агрегировать, оцифровывать и графики строить, значит кто-то поленился заимплементить метрику

ты можешь с группировать например их по userId, и найти всех юзеров у которых произошёл конкретный баг 🤷‍♂

источник

02:36пожаловаться #11

DS

Dmitry Sergeev in Kubernetes — русскоговорящее сообщество

И когда ты по метрикам увидел, когда это произошло и в каком приложении, на кой черт тебе сдалась полнотекстовая индексация?

чтобы посмотреть конкретный запрос, ведь остальные 99 таких же, выполнялись нормально

источник

02:37пожаловаться #12

DS

Dmitry Sergeev in Kubernetes — русскоговорящее сообщество

для чего тогда логи, если не для детального исследования проблемы?

источник

02:38пожаловаться #13

TL

Timofey Larkin in Kubernetes — русскоговорящее сообщество

Так если логи структурированы, то поля типа error_code итп в локи индексируются

источник

02:38пожаловаться #14

TL

Timofey Larkin in Kubernetes — русскоговорящее сообщество

А вот массивный search engine типа эластика, который индексирует непосредственно message - нафиг не нужен

источник

02:39пожаловаться #15

DS

Dmitry Sergeev in Kubernetes — русскоговорящее сообщество

Так если логи структурированы, то поля типа error_code итп в локи индексируются

он в группировки не умеет. Прилетело 10k ошибок, надо понять, от 100 это юзеров или это 10k юзеров кинуло по одной ошибке.

источник

02:41пожаловаться #16

TL

Timofey Larkin in Kubernetes — русскоговорящее сообщество

Плюс к тому времени, когда ты более менее локализовал инцидент в пространстве и времени, линейный поиск оказывается быстрее, чем по индексам, так как область поиска сузилась настолько, что индексация не даёт выигрыша

источник

02:42пожаловаться #17

TL

Timofey Larkin in Kubernetes — русскоговорящее сообщество

он в группировки не умеет. Прилетело 10k ошибок, надо понять, от 100 это юзеров или это 10k юзеров кинуло по одной ошибке.

Если я выгружу их текстом, по json на строчку, я утилитами командной строки решу задачу быстрее и качественнее

источник

02:43пожаловаться #18

DS

Dmitry Sergeev in Kubernetes — русскоговорящее сообщество

Плюс к тому времени, когда ты более менее локализовал инцидент в пространстве и времени, линейный поиск оказывается быстрее, чем по индексам, так как область поиска сузилась настолько, что индексация не даёт выигрыша

хз, loki у меня безбожно тормозил.

источник

02:43пожаловаться #19

TL

Timofey Larkin in Kubernetes — русскоговорящее сообщество

он в группировки не умеет. Прилетело 10k ошибок, надо понять, от 100 это юзеров или это 10k юзеров кинуло по одной ошибке.

А ещё есть сентри, который сам группирует ошибки

источник

02:44пожаловаться #20