Size: a a a

2021 April 05

N

Nikita Blagodarnyy in Data Engineers
на повышение пошёл. в промнефтегазхимбанк.
источник

AZ

Anton Zadorozhniy in Data Engineers
Помимо опсовых проблем Кафка даёт массу архитектурных и опсовых плюсов, я бы так не хаял архитектуру не зная всех деталей
источник

AF

Asd Fgh in Data Engineers
А как исправлять то? Пока что такой пайплайн нарисовал:
Splunk=>Splunk Hadoop connect app=>HDFS=>Spark/Flink/Storm/etc
источник

AZ

Anton Zadorozhniy in Data Engineers
Asd Fgh
А как исправлять то? Пока что такой пайплайн нарисовал:
Splunk=>Splunk Hadoop connect app=>HDFS=>Spark/Flink/Storm/etc
Какой поток, какие сценарии использования этих данных?
источник

AF

Asd Fgh in Data Engineers
Asd Fgh
Секурити дата лейк для долговременного хранения логов, создания machine  learning  моделей и светлого коммунизма, а спланк не резиновый и соответсвенно в нем настроена автоочистка логов старше 90 дней
Вот
источник

AZ

Anton Zadorozhniy in Data Engineers
Asd Fgh
Вот
Стриминговая бизнеслогика вся в спланке?
источник

AZ

Anton Zadorozhniy in Data Engineers
Какой поток, дневная полка в гигабайтах и сообщениях?
источник

AE

Alexey Evdokimov in Data Engineers
а сами-то логи это логи чего и откуда? может сплунк и не нужен вовсе на самом деле-то
источник

AE

Alexey Evdokimov in Data Engineers
вдруг их напрямую можно хоть той же кафкой разгребать или чем ещё?
источник

AF

Asd Fgh in Data Engineers
Стриминг в Cribl и Kafka streams насколько я понял
источник

AE

Alexey Evdokimov in Data Engineers
эт понятно кто консюмит. вопрос про кто продюсит
источник

AZ

Anton Zadorozhniy in Data Engineers
Кмк вы пока плохо понимаете что есть, зачем используется, и какие узкие места; могу только порекомендовать не принимать каких-то дорогих архитектурных решений, пока вы не проясните что и как

Для самого дешевого оффлоада спланка можете класть оттуда напрямую данные в объектный сторадж, а там работать с ним спарком, пока не прояснятся другие бизнес кейсы
источник

AZ

Anton Zadorozhniy in Data Engineers
(HDFS, S3 или GCS там зависит от того на чем вы живете, что умеете в плане инфраструктуры)
источник

AF

Asd Fgh in Data Engineers
Контора закупила кластер клаудеры чтобы использовать его как большую hdfs файлопомойку, а мне теперь остаётся скрестить ежа с ужом, тк наш единственный индюк биг дата инженер за полгода работы не смог задеплоить ни одного кластера кафки/хадупа😂
источник

AZ

Anton Zadorozhniy in Data Engineers
Тогда пишите просто в HDFS напрямую из спланка, там дальше разберётесь)
источник

AE

Alexey Evdokimov in Data Engineers
если надо сделать непонятно что и неизвестно зачем, то удачи, что ли
источник

AZ

Anton Zadorozhniy in Data Engineers
Ну понятно что надо оффлоад сделать пока, если проблема с окном в спланке
источник

AZ

Anton Zadorozhniy in Data Engineers
В начале десятых годов это был самый хлеб хадупа в энтерпрайзе, оффлоад из проприетарных решений.. сколько я видел «даталейков», которые наливались из хранилищ)
источник

ПБ

Повелитель Бури... in Data Engineers
Anton Zadorozhniy
В начале десятых годов это был самый хлеб хадупа в энтерпрайзе, оффлоад из проприетарных решений.. сколько я видел «даталейков», которые наливались из хранилищ)
что значит был? )
источник

AF

Asd Fgh in Data Engineers
У нас тут до сих пор начало нулевых, месяц назад днс заработал 🙈
источник