Size: a a a

2021 April 03

PA

Panchenko Andrey in Data Engineers
@pomadchin  тут попки завезли...
источник

ЕГ

Евгений Глотов... in Data Engineers
Повелитель Бури
Доброй пятницы! Коллеги хочется получить ачивку за безопасность ) скажите пожалуйста apache ranger достататочно покурить чтобы хадуп окружить внимпнием и заботой. Может есть бест практис. И инете мало инфы , но возможно не те слова гуглю 🧐 спасибо
Спарк игнорирует правила доступа, которые установлены в рэнжере на хайв таблицы, так как читает данные напрямую из хдфс. Нужно ставить права либо и на хайв, и дублировать на хдфс, либо где-то плагины искать для спарка, может уже кто-то написал и на гитхабе есть
источник

S

Stanislav in Data Engineers
Евгений Глотов
Спарк игнорирует правила доступа, которые установлены в рэнжере на хайв таблицы, так как читает данные напрямую из хдфс. Нужно ставить права либо и на хайв, и дублировать на хдфс, либо где-то плагины искать для спарка, может уже кто-то написал и на гитхабе есть
Hwc использовать, и страдать, страдать
источник

S

Stanislav in Data Engineers
Хортоны написали уже 2 года как)
источник

ЕГ

Евгений Глотов... in Data Engineers
Stanislav
Hwc использовать, и страдать, страдать
Зачем страдать, если можно забить на секьюрити
источник

ЕГ

Евгений Глотов... in Data Engineers
Stanislav
Хортоны написали уже 2 года как)
Я использовал его 3 года назад)
источник

ЕГ

Евгений Глотов... in Data Engineers
Он уже тогда был фуфло
источник

N

Nikita Blagodarnyy in Data Engineers
Вполне достаточно включить сесуриту hdfs для хайва, прозрачную структуру каталогов баз, настроить обе политики hive/hdfs на доменные группы и просто пихать людей в группы потом.
источник
2021 April 04

K

KrivdaTheTriewe in Data Engineers
Переслано от KrivdaTheTriewe
Ребя, кто с цепелином в живой природе использует спарк 3.1 ?
источник

MK

Mikhail Kalugin in Data Engineers
KrivdaTheTriewe
Переслано от KrivdaTheTriewe
Ребя, кто с цепелином в живой природе использует спарк 3.1 ?
Работает, но есть нюанс...  А в чем дело то?
источник
2021 April 05

Y

Ya Anna in Data Engineers
Привет, есть тут те, кто работают в одноклассниках?
источник

AZ

Aleksandra Zaytseva in Data Engineers
Узнай, как data-driven компании разрабатывают платформы данных и внедряют их в бизнес-процессы

13 апреля в 19:00 МСК Yandex.Cloud, Леруа Мерлен, Авито и Райффайзенбанк поговорят о методах и инструментах скоринга входных данных, их агрегации и создании единой системы.
Мы расскажем вам, как:
📍в Yandex.Cloud подошли к решению задачи поддержки хранения и обработки данных в СУБД ClickHouse в S3;
📍в Авито упростили и консолидировали работу дата-специалистов с витринами данных;
📍в Райффайзенбанке решили задачу расположения банкоматов с помощью JupyterHub и создали модель оптимизации ценообразования в тендерах при помощи Jupyter на Mac;
📍в Леруа Мерлен обучили модель контролировать качество товара от поставщиков на складах на основе lightGBM.

✅Получить приглашение на мероприятие по ссылке https://clck.ru/TtDCx
источник

AF

Asd Fgh in Data Engineers
Посоны, насколько адекватна следующая архитектура дата пайплайна:

Splunk Heavy forwarder=>Cribl=>Kafka=>HDFS=>Nifi

Я сам ни разу не дата инженер, а девопс, сильно не пинайте
источник

e

er@essbase.ru in Data Engineers
а что за задача ?
источник

AF

Asd Fgh in Data Engineers
Секурити дата лейк для долговременного хранения логов, создания machine  learning  моделей и светлого коммунизма, а спланк не резиновый и соответсвенно в нем настроена автоочистка логов старше 90 дней
источник

SS

Sergey Sheremeta in Data Engineers
Asd Fgh
Посоны, насколько адекватна следующая архитектура дата пайплайна:

Splunk Heavy forwarder=>Cribl=>Kafka=>HDFS=>Nifi

Я сам ни разу не дата инженер, а девопс, сильно не пинайте
на мой взгляд, связка "Kafka=>HDFS=>Nifi" некорректна/неудобна, быть может, лучше так:
Kafka=>NiFi=>HDFS=>Spark/etc
источник

AF

Asd Fgh in Data Engineers
Почему?
источник

АЖ

Андрей Жуков... in Data Engineers
Ну вообще не очень понятно, что нафаня тут делает
источник

A

Alex in Data Engineers
оркестратор?
источник

DM

Dan M. in Data Engineers
Что он в конце цепочки оркестрирует?
источник