Size: a a a

Обсуждения техдирские

2019 August 30

NK

ID:0 in Обсуждения техдирские
Продолжение обсуждения про ЛОГИ

2.4 fluentbit
Специалист по запуску сложных финтех стартапов:
посмотри на fluentbit. Он попроще и сильно быстрее fluent. Теоретически вместо kafka можно оставить тот же fluentbit на стороне агрегатора и через свой простой обработчик кидать в CH. Получается тоже вполне норм, хотя нужно будет думать про балансировку.

2.5 rsyslog
Тимлид большой соцсети: Rsyslog
ужасен в плане документации. Это одна из причин почему на него многие плюются.
Если вариативность источников большая (системные логи/приложений/скриптов итд) с ним будет проще так как syslog умеют «все» и уже скорее всего туда пишут.
Из него далее можно слать и в CH и в Kafka и в /dev/null
В плане пересылки мы сталкивались только с одной проблемой.
- Если очередь на rsyslog накопилась большая (получатель был недоступен, а очередь мы задрали) то по восстановлению rsyslog флашит очередь в рамках одной TCP сессии, а это не балансируется (возможно проблема именно само output модуля).  
С препроцессингом (форматированием, парсингом) на нём конечно сложнее, но возможно.
Интересные посты по теме (правда уже немного устаревшие):
https://labs.spotify.com/2016/02/25/spotifys-event-delivery-the-road-to-the-cloud-part-i/
https://labs.spotify.com/2016/03/03/spotifys-event-delivery-the-road-to-the-cloud-part-ii/
https://labs.spotify.com/2016/03/10/spotifys-event-delivery-the-road-to-the-cloud-part-iii/

2.6 собственное решение
Тимлид SRE в банке:
Мы такое сами пишем. Задачка не очень сложная. Надо просто хитрый конфиг файл к JVM написать.
Очень просто взять нормальный язык программирования и написать как именно надо их доставлять, чем мучиться с опенсорсным гавном для админов. И будет вам и сжатие, и переподключения, и метрики какие вам нужны.
И буферизация, и вообще любые выкрутасы, и очень удобный минимальный конфиг ибо под себя напишете или даже отсутствие конфига. Автодетект и всё.

3 Промежуточная обработка
3.1 splunk
Специалист по запуску сложных финтех стартапов:
И если перед CH стоит свой обработчик, то на него можно вешать всякие полезные штуки типа автоподсчета скользящих метрик или отправки части потока для, например, СБ в другую систему (наши Спланк любили). И прочую полезную логику, которую хочется делать онлайн (а еще у нас там была третья линия проверки на просочившиеся в логи PANы)
источник

NK

ID:0 in Обсуждения техдирские
Продолжение темы про ЛОГИ

4 Хранение
4.1 elastic
Фаундер, технарь на должности CTO:
А у индексов эластика пробовали кодек поменять (index.codec параметр)? По умолчанию он и не стоит на максимальном сжатии, а на максимальной производительности алгоритмом LZ4. При нормально написанном маппинге и выставленном максимальном сжатии в deflate не должно сильно отличаться, lucene не такой уж и большой индекс.
Скб-контур собирает с 50+ сервисов логи,  у них там почти два петабайта уже: https://www.youtube.com/watch?v=KH4Ia0uir8Y если интересно
Вот, почитайте. Тут все рекомендации собраны: https://www.elastic.co/guide/en/elasticsearch/reference/7.3/tune-for-disk-usage.html
Там и про снижение объёма хранимых данных тоже написано, каждый индекс настраиваться под нужные данные, что будет храниться, а что нет. А чуть ниже есть и про сжатие.

Топик-стартер: У меня к эластику вопросов вообще нет, в плане поиска по тексту, особенно не четкому он помоему уделывает всех. Но накладные расходы на хранение это жесть :)
И да под не текстовую аналитику, я бы что то другое выбрал :)

Решатель SRE/ChatOPS/DevOps задачек в мониторинге: На прошлом HighLoad++ VK рассказывали, как решали похожую проблему. Они выбрали Clickhouse + самописный сервис для записи, который они выложили в опенсорс https://m.habr.com/ru/company/vk/blog/430168/
Специалист по запуску сложных финтех стартапов
А вообще логи в CH можно и более чем в 10 раз жать. Ну и возможность все старше нескольких дней убирать в архив тут крайне ценная.

5 Железо
Тимлид большой соцсети:
2 петабайта! Это сколько на дата ноду?
Технический директор фото-сервиса: без сжатия это считай полнстью забитая оборудованием стойка и стоит такое удовольствие 200-300к usd.
Владелец и технический руководитель своего проекта: Это ты на ssd посчитал? Есть пограничные конфигурации, где 2 петабайта можно впихнуть в 8u.
Технический директор фото-сервиса: я пихал, но начитнается беда с сетевым вводом и поиском.
Владелец и технический руководитель своего проекта: Ага. Я говорю про огромные ящики, в которых один дохлый ксеончик обслуживает 96 хардов. Те это только очень холодный архив.
Технический директор фото-сервиса: и фиг туда что загрузишь! и фиг туда что загрузишь!
Владелец и технический руководитель своего проекта: Внезапно, надо проконсультироваться у инженера здания
Технический директор фото-сервиса: а под нагрузкой - под 20KW жрет стойка, при охлаждением этого воздухом в коридорах становится ВЕТРЕННО

6 Просмотр
6.1 lighthouse
Специалист по запуску сложных финтех стартапов
И чем логи смотреть планируете? Нам пока больше всего понравился lighthouse (или запросами промо из DataGrip/IDEA)
источник

NN

Nick Nickov in Обсуждения техдирские
Старый Хрыч
вылечите артроз и рак пожжелудочной))))
Сейчас это не возможно но в будущем кто знает. Если есть вероятность в будущембзначит можно
источник

СХ

Старый Хрыч in Обсуждения техдирские
ID:
Продолжение темы про ЛОГИ

4 Хранение
4.1 elastic
Фаундер, технарь на должности CTO:
А у индексов эластика пробовали кодек поменять (index.codec параметр)? По умолчанию он и не стоит на максимальном сжатии, а на максимальной производительности алгоритмом LZ4. При нормально написанном маппинге и выставленном максимальном сжатии в deflate не должно сильно отличаться, lucene не такой уж и большой индекс.
Скб-контур собирает с 50+ сервисов логи,  у них там почти два петабайта уже: https://www.youtube.com/watch?v=KH4Ia0uir8Y если интересно
Вот, почитайте. Тут все рекомендации собраны: https://www.elastic.co/guide/en/elasticsearch/reference/7.3/tune-for-disk-usage.html
Там и про снижение объёма хранимых данных тоже написано, каждый индекс настраиваться под нужные данные, что будет храниться, а что нет. А чуть ниже есть и про сжатие.

Топик-стартер: У меня к эластику вопросов вообще нет, в плане поиска по тексту, особенно не четкому он помоему уделывает всех. Но накладные расходы на хранение это жесть :)
И да под не текстовую аналитику, я бы что то другое выбрал :)

Решатель SRE/ChatOPS/DevOps задачек в мониторинге: На прошлом HighLoad++ VK рассказывали, как решали похожую проблему. Они выбрали Clickhouse + самописный сервис для записи, который они выложили в опенсорс https://m.habr.com/ru/company/vk/blog/430168/
Специалист по запуску сложных финтех стартапов
А вообще логи в CH можно и более чем в 10 раз жать. Ну и возможность все старше нескольких дней убирать в архив тут крайне ценная.

5 Железо
Тимлид большой соцсети:
2 петабайта! Это сколько на дата ноду?
Технический директор фото-сервиса: без сжатия это считай полнстью забитая оборудованием стойка и стоит такое удовольствие 200-300к usd.
Владелец и технический руководитель своего проекта: Это ты на ssd посчитал? Есть пограничные конфигурации, где 2 петабайта можно впихнуть в 8u.
Технический директор фото-сервиса: я пихал, но начитнается беда с сетевым вводом и поиском.
Владелец и технический руководитель своего проекта: Ага. Я говорю про огромные ящики, в которых один дохлый ксеончик обслуживает 96 хардов. Те это только очень холодный архив.
Технический директор фото-сервиса: и фиг туда что загрузишь! и фиг туда что загрузишь!
Владелец и технический руководитель своего проекта: Внезапно, надо проконсультироваться у инженера здания
Технический директор фото-сервиса: а под нагрузкой - под 20KW жрет стойка, при охлаждением этого воздухом в коридорах становится ВЕТРЕННО

6 Просмотр
6.1 lighthouse
Специалист по запуску сложных финтех стартапов
И чем логи смотреть планируете? Нам пока больше всего понравился lighthouse (или запросами промо из DataGrip/IDEA)
😓блин как я вовремя свалил с того проекта, у анс там тоже напечался эластик в петабайт, ток на железо и охлаждение даже близко столько денег не было
источник

СХ

Старый Хрыч in Обсуждения техдирские
а не, было, но чтот по моему 300к usb на петобайтный эластик будет маловато
источник

PD

Phil Delgyado in Обсуждения техдирские
Nick Nickov
пишите НДА нормальное и давайте разрабам на подпись
Эээ, тут НДА не поможет. Доступ к ПДН регулируется законодательством и там все совсем не просто...
И зачем разработчикам прямой доступ к ПДН?
Или они еще и PANы могут смотреть в открытом виде?
источник

AS

Andrey Shetukhin in Обсуждения техдирские
Nick Nickov
любая проблема так или иначе решаема, достаточно начать думать над ее решением
Нет. Нельзя лететь быстрее скорости света. Эта штука  -  ограничение физической среды передачи информации.
источник

NN

Nick Nickov in Обсуждения техдирские
так... мы же не в канале физиков-фантастов, ок?
источник

NN

Nick Nickov in Обсуждения техдирские
и прочих лекарей
источник

NN

Nick Nickov in Обсуждения техдирские
я это имел в виду про нашу каждодневную рутину
источник

NN

Nick Nickov in Обсуждения техдирские
хорош уже, ладно
источник

AR

Anton Rusakov in Обсуждения техдирские
Andrey Shetukhin
Нет. Нельзя лететь быстрее скорости света. Эта штука  -  ограничение физической среды передачи информации.
Да. Несуществует такого утверждения которое бы не опровергул Ще.
источник

NN

Nick Nickov in Обсуждения техдирские
точнее уже вашу рутину :)
источник

AS

Andrey Shetukhin in Обсуждения техдирские
Alex B
нет и не должны вообще никогда. доступ туда у dba, возможно у тех/тим лида/лидов. как бекапы: одни не делают, другие уже делают.
У любого разработчика, если он не макака-резус, есть потенциальная возможность доступа к проду. Чтобы его не было, надо очень сильно постараться. Либо это проект очередного вебмагазина на похапэ, где закладку можно увидеть глазами, прочитав все коммиты.
источник

AS

Andrey Shetukhin in Обсуждения техдирские
Nick Nickov
я это имел в виду про нашу каждодневную рутину
Наша каждодневная рутина - это ИМЕННО борьба с физическими ограничениями среды. Чтобы эта борьба была хоть как-то эффективна, надо чётко знать, что и как не решаемо и не может быть решено.
источник

NN

Nick Nickov in Обсуждения техдирские
я не склонен заниматься демагогией на изотерические темы, извините.. работать надо
источник

AS

Andrey Shetukhin in Обсуждения техдирские
Nick Nickov
я не склонен заниматься демагогией на изотерические темы, извините.. работать надо
Это не демагогия. Непонимание того, что есть нерешаемые проблемы - основная причина траты времени на изобретение неработающих велосипедов.

Есть такой чувак - Aphyr, он ведёт отличнейший блог о том, как другие чуваки, которые верят, что достаточно подумать,  "решают" прблемы, лол.
источник

NN

Nick Nickov in Обсуждения техдирские
окей, вы правы  - я не прав... только перестаньте мне писать - телефон звенит
источник

AS

Andrey Shetukhin in Обсуждения техдирские
Nick Nickov
окей, вы правы  - я не прав... только перестаньте мне писать - телефон звенит
Давайте вы мне не будете указывать, писать мне в чат или нет. Вы здесь не админ. Не нравится - есть кнопка Mute.
источник

NN

Nick Nickov in Обсуждения техдирские
МНЕ писать.. перестаньте пожалуйста отвечать мне.. можете просто в чат писать - я обязательно прочту позже?
источник