Телеграмм чат группы hadoopusers страница 2891

parrot.ru

Рейтинг популярных групп и каналов

В рейтинге участвует:

групп:

каналов:

Виртуальный сервер на SSD - недорого!

Аренда выделенных и виртуальных серверов (VDS/VPS), хостинг, аренда IP-адресов, администрирование, круглосуточная поддержка

qwarta.ru подробнее

Резервное копирование с проверкой на вирусы!!!

Удобный сервис создания резервных копий на любой сервер сети интернет. Отслеживайте изменения, проверяйте на вирусы. Надежно защитите свой бизнес!

go.backupland.com

Выбираете сервер? Любая конфигурация на заказ!

Аренда физических серверов любых конфигураций под любые запросы - 1С бухгалтерия, игровые сервера, нагруженные проекты, интернет-магазины!

qwarta.ru подробнее

Size: a a a

Data Engineers

2007 membersпожаловаться на группу

2020 October 21

AP

Anton Polyakov in Data Engineers

Хм… Нет. Не знаю. Есть канал по архитектуре данных, может там подскажут. Я кроме спецификаций на волт и энкор читал только материалы конференций и копался в моделях ))

а что за канал по архтектуре?

источник

18:37пожаловаться #1

MV

Mitya Volodin in Data Engineers

https://t.me/data_architect

Архитектура данных

Data Governance, dwh, big data, data lake - обсуждаем, ссылки на статьи, конференции, полезные каналы.
Чатик по airflow - https://t.me/ruairflow

источник

18:37пожаловаться #2

MV

Mitya Volodin in Data Engineers

Там даже уже это спрашивали

источник

18:38пожаловаться #3

AP

Anton Polyakov in Data Engineers

https://t.me/data_architect

Архитектура данных

Data Governance, dwh, big data, data lake - обсуждаем, ссылки на статьи, конференции, полезные каналы.
Чатик по airflow - https://t.me/ruairflow

спасибо!

источник

18:38пожаловаться #4

MV

Mitya Volodin in Data Engineers

Можно посмотреть в shared links/docs

источник

18:38пожаловаться #5

AZ

Anton Zadorozhniy in Data Engineers

чот как-то там сухо и по делу

источник

18:39пожаловаться #6

AZ

Anton Zadorozhniy in Data Engineers

тут веселее

источник

18:39пожаловаться #7

AN

Andrew Nasonov in Data Engineers

Господа дата инженеры, можете пожалуйста что-нибудь посоветовать по следующему кейсу?
Есть кафка, есть желание все что в ней было складывать в хдфс. Номинально в целях холодного хранения, однако все-таки данные частенько смотрят бизнес аналитики (больше никуда данные в таких объемах не пишутся), так что должна быть какая-то оперативность. Чем лучше всего организовать своевременный транспорт данных из кафки в хдфс, если кафка-коннект - не вариант? Пока что смотрели в сторону spark streaming и NiFi . Ощущение что первое - это из пушки по комарам, а второе - микроскопом гвозди

источник

19:34пожаловаться #8

АЖ

Андрей Жуков... in Data Engineers

ну и выгребайте спарком раз в час/день/неделю топики, раз холодное хранилище

источник

19:36пожаловаться #9

АЖ

Андрей Жуков... in Data Engineers

или оперативность - рилтайм?

источник

19:36пожаловаться #10

AN

Andrew Nasonov in Data Engineers

Нет, держим аналитиков в строгости)

источник

19:37пожаловаться #11

AN

Andrew Nasonov in Data Engineers

Как единое приложение со списком топиков организовать и поставить на расписание?

источник

19:37пожаловаться #12

АЖ

Андрей Жуков... in Data Engineers

ну, airflow, prefect, oozie и тому подобное

источник

19:38пожаловаться #13

АЖ

Андрей Жуков... in Data Engineers

но можно и нафаню

источник

19:38пожаловаться #14

АЖ

Андрей Жуков... in Data Engineers

сразу на все цели

источник

19:38пожаловаться #15

AZ

Anton Zadorozhniy in Data Engineers

Andrew Nasonov

Господа дата инженеры, можете пожалуйста что-нибудь посоветовать по следующему кейсу?
Есть кафка, есть желание все что в ней было складывать в хдфс. Номинально в целях холодного хранения, однако все-таки данные частенько смотрят бизнес аналитики (больше никуда данные в таких объемах не пишутся), так что должна быть какая-то оперативность. Чем лучше всего организовать своевременный транспорт данных из кафки в хдфс, если кафка-коннект - не вариант? Пока что смотрели в сторону spark streaming и NiFi . Ощущение что первое - это из пушки по комарам, а второе - микроскопом гвозди

если у вас дистрибутив Confluent - берите Kafka Connect

источник

19:39пожаловаться #16

АЖ

Андрей Жуков... in Data Engineers

Anton Zadorozhniy

если у вас дистрибутив Confluent - берите Kafka Connect

грит же, зобанено

источник

19:39пожаловаться #17

AN

Andrew Nasonov in Data Engineers

Нафаню ну такое, мануально создавать надо каждый раз поток или писать какую-то странную генерилку эксмелей (
А вот у нас не конфлюэнт, такие дела

источник

19:39пожаловаться #18

AN

Andrew Nasonov in Data Engineers

А шо там в даг запихивать? Тем более spark streaming штатно не завершишь

источник

19:39пожаловаться #19

AN

Andrew Nasonov in Data Engineers

А, хотя там не стриминг, там просто выгребать батчелопатой

источник

19:40пожаловаться #20