Телеграмм чат группы uptime_community страница 369

Глеб Русин Uptime Day in uptime.community

11:21пожаловаться #1

Г

Eugene Budanov

А можете, наконец, названия и список докладов сюда скинуть? Не мне надо, начальству показать.

Буквально завтра всё будет допилено! Утрясаем некоторые оргмоменты 😊

11:22пожаловаться #2

2019 March 12

A

Может кто то понимает best practise для сбора метрик. Придумал я себе SLI, я его могу собрать по логам nginx. Но во превых каждый раз чтобы посторить график дорого пробегать по логу. Да и elastic не вечно хранит лог. Итого нужна таска которая будет аккумулировать данные из лога, раз в секунду или минуту. И класть в nosql.

19:51пожаловаться #3

A

Может есть готовые практики. Или просто скрипт в cron?

19:51пожаловаться #4

IB

Ivan Brotkin in uptime.community

Не бест практис, но мы тупо сделали скриптик, который в json собирает стату из логов (по урлам группировали в продукты, считали avg, count и тд). Данные подгружали через google appscript в гуглтаблицу и уже там на исходных данных собирали таблицы с данными ежечасно, посуточно и понедельно. Местами костыльно, но дешево и практично))

20:01пожаловаться #5

IB

Ivan Brotkin in uptime.community

Сейчас вот думаем эти данные уже в бд загонять.

20:02пожаловаться #6

S

Может кто то понимает best practise для сбора метрик. Придумал я себе SLI, я его могу собрать по логам nginx. Но во превых каждый раз чтобы посторить график дорого пробегать по логу. Да и elastic не вечно хранит лог. Итого нужна таска которая будет аккумулировать данные из лога, раз в секунду или минуту. И класть в nosql.

За бест практиз не скажу, но могу сказать как эту задачу решали мы

20:18пожаловаться #7

A

Весь одно большое внимание

20:22пожаловаться #8

MS

Max Selezenev in uptime.community

Может есть готовые практики. Или просто скрипт в cron?

Разве стандартный elastic-logstash-kibana не решает это?

20:30пожаловаться #9

A

Как?

20:31пожаловаться #10

A

Ну вот логи лежат. В еластик в логах есть code:200 latency: 300ms в каждой строке

20:32пожаловаться #11

A

Я их хочу посчитать и отобразить.

20:32пожаловаться #12

A

Но и логи в елк не вечно. А эту статистику я хочу дольше

20:32пожаловаться #13

MS

Max Selezenev in uptime.community

Но и логи в елк не вечно. А эту статистику я хочу дольше

Почему не вечно?

20:33пожаловаться #14

A

Ну так заведено в компании. Мне это тяжело ломать. Потом они уходят в другое место хранения. Где лежат всеми забытые логи. Их просто много

20:34пожаловаться #15

S

Весь одно большое внимание

1. Сделали обрезанную версию лога в дополнение к основному
2. Сделали автосоздание логов по минутно
3. Раз в сколько-то секунд приходит скрипт, дернутый заббикс агентом и выгребает стату из файликов, очищая их (последняя минута не чистится при этом, а просто актуализируется)

До определенной нагрузки это рабочее решение. Дальше - надо более продвинутым образом решать.

20:34пожаловаться #16

S

Заббикс например позволяет агрегированную инфу хранить дольше чем подробную и графики от этого особо не портятся при автоочистке детализации

20:35пожаловаться #17

S

Ну так заведено в компании. Мне это тяжело ломать. Потом они уходят в другое место хранения. Где лежат всеми забытые логи. Их просто много

1ТБ логов в день у нас было с основных эндпоинтов с нжинксом

20:36пожаловаться #18

A

У меня просто нет доступа к файлам :) . Я начинаю свою работу уже от еластика. Задача понять когда и как мы вываливаемся за sla

20:36пожаловаться #19

S

Так не правильно - тебе надо в логстеше предагрегировать это зло, и писать в эластик только те полные записи, которые о сбоях