Size: a a a

Kubernetes — русскоговорящее сообщество

2020 October 28

DS

Dmitry Sergeev in Kubernetes — русскоговорящее сообщество
Timofey Larkin
Если я выгружу их текстом, по json на строчку, я утилитами командной строки решу задачу быстрее и качественнее
ясно,  нет я пас . Группировка по полю делается одной кнопкой в интерфейсе,  логи качать для анализа - такое себе решение, когда это моментально можно сделать.
источник

TL

Timofey Larkin in Kubernetes — русскоговорящее сообщество
Интерфейс не настолько функционален, как jq, и этот претензия в адрес локи в том числе.
источник

TL

Timofey Larkin in Kubernetes — русскоговорящее сообщество
Но для таких группировок всё таки есть сентри
источник

TL

Timofey Larkin in Kubernetes — русскоговорящее сообщество
Если бы я мог эффективно юзать всякие утилитки из терминала прямо в веб морде, с хотя бы 20 процентов скорости от реального терминала, я бы возможно поменял своё мнение
источник

DS

Dmitry Sergeev in Kubernetes — русскоговорящее сообщество
Timofey Larkin
Интерфейс не настолько функционален, как jq, и этот претензия в адрес локи в том числе.
там всего хватает. Даже медианы, стандартное отклонение,  перцентли, и подобное. А также быстро можно  сгруппировать сколько процентов ошибок было по всем вариациям значений нескольких полей, и вывести это в виде pie диаграммы например. Какой тут jq вообще. Да и ошибок может быть не мало, например надо анализировать данные за месяц, запаришься скачивать
источник

TL

Timofey Larkin in Kubernetes — русскоговорящее сообщество
Dmitry Sergeev
там всего хватает. Даже медианы, стандартное отклонение,  перцентли, и подобное. А также быстро можно  сгруппировать сколько процентов ошибок было по всем вариациям значений нескольких полей, и вывести это в виде pie диаграммы например. Какой тут jq вообще. Да и ошибок может быть не мало, например надо анализировать данные за месяц, запаришься скачивать
Да йопт, какие медианы? Посчитай мне медиану от набора строк "вася", "ошибка 404", "неверный пароль", "200 ок".

Логи - это текст, зачем мне пайчарты и прочая хуйня для манагеров? Мне нужно найти, допустим, что предшествовало сегфолту, что локально я сделаю как grep segfault -B 100
источник

DS

Dmitry Sergeev in Kubernetes — русскоговорящее сообщество
Timofey Larkin
Если бы я мог эффективно юзать всякие утилитки из терминала прямо в веб морде, с хотя бы 20 процентов скорости от реального терминала, я бы возможно поменял своё мнение
мна терминала хватает. jq, grep, awk, sed, tr,  и т.д. ты мне точно не продашь, я их итак каждый день юзаю. Если анализ логов в loki, предполагает их использовать - это не очень как по мне
источник

TL

Timofey Larkin in Kubernetes — русскоговорящее сообщество
Почему ты так много раз упоминаешь группировку ошибок но упорно игноришь упоминания сентри?
источник

DS

Dmitry Sergeev in Kubernetes — русскоговорящее сообщество
Timofey Larkin
Почему ты так много раз упоминаешь группировку ошибок но упорно игноришь упоминания сентри?
да что тут про sentry говорить, хороший инструмент. Но группировка по полю прекрасно работает  и в graylog 🤷‍♂
источник

TL

Timofey Larkin in Kubernetes — русскоговорящее сообщество
Казалось бы, вот тулза, которая рассматривает ошибку не как отдельную строку из текстового стрима, а как отдельный объект со своими свойствами.
источник

TL

Timofey Larkin in Kubernetes — русскоговорящее сообщество
Раз ошибку можно рассматривать как ошибку, а не кусок текст, её можно не срать в текст, как мне кажется
источник

TL

Timofey Larkin in Kubernetes — русскоговорящее сообщество
Ладно, у нас разные боли видимо. Пойду спать.
источник

DS

Dmitry Sergeev in Kubernetes — русскоговорящее сообщество
Timofey Larkin
Казалось бы, вот тулза, которая рассматривает ошибку не как отдельную строку из текстового стрима, а как отдельный объект со своими свойствами.
можно вообще в clickhouse лить, и в redash анализировать. Но это опять менее удобно на самом деле. Ну удобней кстати чем в grafana
источник

DS

Dmitry Sergeev in Kubernetes — русскоговорящее сообщество
Timofey Larkin
Ладно, у нас разные боли видимо. Пойду спать.
скорее всего. Спокойной ночи
источник

TL

Timofey Larkin in Kubernetes — русскоговорящее сообщество
Dmitry Sergeev
скорее всего. Спокойной ночи
)
источник

DS

Dmitry Sergeev in Kubernetes — русскоговорящее сообщество
Sergey Trapeznikov
может вопрос все же к церкви метрик, но может тут кто шарит, по какой формуле можно высчитать процент cpu util для пода, от его лимита?
Обычно все метрики пляшут от лимита хоста
100 * sum(rate(container_cpu_usage_seconds_total{container!="",container!="POD"}[5m])) by (namespace, pod, container) / sum(kube_pod_container_resource_limits{container!="",container!="POD",resource="cpu"}) by (namespace, pod, container)

Вот так у меня. Если я конечно правильно тебя понял.
источник

ST

Sergey Trapeznikov in Kubernetes — русскоговорящее сообщество
Dmitry Sergeev
100 * sum(rate(container_cpu_usage_seconds_total{container!="",container!="POD"}[5m])) by (namespace, pod, container) / sum(kube_pod_container_resource_limits{container!="",container!="POD",resource="cpu"}) by (namespace, pod, container)

Вот так у меня. Если я конечно правильно тебя понял.
вроде оно
kube_pod_container_resource_limits{resource="cpu")

просто я вместо этого значения зачем то искал request cores(тк реквесты равны лимиту в моей конфигурации), и получается расхождение в числительных величинах, если цпу время будет делиться на количество запрашиваемых ядер, будет неок)
А так вроде оно, я потраю с разрабами, спс
источник

ST

Sergey Trapeznikov in Kubernetes — русскоговорящее сообщество
Dmitry Sergeev
100 * sum(rate(container_cpu_usage_seconds_total{container!="",container!="POD"}[5m])) by (namespace, pod, container) / sum(kube_pod_container_resource_limits{container!="",container!="POD",resource="cpu"}) by (namespace, pod, container)

Вот так у меня. Если я конечно правильно тебя понял.
со всем кроме прометей оператора сработало
под прометей оператора говорит что он при такой формуле 219%))
источник

GG

George Gaál in Kubernetes — русскоговорящее сообщество
Timofey Larkin
А если их агрегировать, оцифровывать и графики строить, значит кто-то поленился заимплементить метрику
Арм знаешь ? Зипкин. Егери. Это логи. Какие метрики. А вот логи приложений... вот прям логи - их ценность преувеличена
источник

GG

George Gaál in Kubernetes — русскоговорящее сообщество
Dmitry Sergeev
ты можешь с группировать например  их по userId, и найти всех юзеров у которых произошёл конкретный баг 🤷‍♂
Арм. Поток событий. Инструментированные приложения. Логи ни при чем
источник