Size: a a a

2020 November 04

E

Evgeny in Data Engineers
Хм, 3 строки в топологии :/
источник

Д

Дмитрий in Data Engineers
Да, бывает 2 строчки кода 6 месяцев согласования ...
источник

E

Evgeny in Data Engineers
Смахивает на банковскую сферу ;)
источник

Д

Дмитрий in Data Engineers
Почти ...
источник

E

Evgeny in Data Engineers
Дмитрий
Коллеги, есть вопрос. Имеется керберизированный кластер hadoop, с настроенным KNOX (Yarn, HDFS, HIVE). Есть необходимость запускать задачи PySPARK через KNOX. Подскажите куда копать для настройки spark-submit, для запуска через KNOX.
Кстати, а у вас knox оно как? SSO?
источник

Д

Дмитрий in Data Engineers
Керберос...
источник

AZ

Anton Zadorozhniy in Data Engineers
Интерактивные никак, для батча - собираете сборку, пишете на HDFS через нокс, потом через YARN клиент толкаете его
источник

E

Evgeny in Data Engineers
Ах да
источник

AZ

Anton Zadorozhniy in Data Engineers
Пример (старые, но идеи те же работать будут ) https://layer4.fr/blog/2016/11/09/spark-job-via-knox-yarn/
источник

Д

Дмитрий in Data Engineers
Anton Zadorozhniy
Интерактивные никак, для батча - собираете сборку, пишете на HDFS через нокс, потом через YARN клиент толкаете его
Блин, так умею .... но собирать pyspark
источник

AZ

Anton Zadorozhniy in Data Engineers
Дмитрий
Блин, так умею .... но собирать pyspark
Безопасность это трудно и дорого, не завидую вам
источник

AZ

Anton Zadorozhniy in Data Engineers
Но Нокс отличный прокси, простенький и удобный, если нужно текстовые апишки проксить - то что надо
источник

Д

Дмитрий in Data Engineers
Да я его заценил для hbase и hive jdbc.
источник

Д

Дмитрий in Data Engineers
Но нужно строить нормальную инфраструктуру для него. А сейчас так сбоку ....
источник

AZ

Anton Zadorozhniy in Data Engineers
Скорости или пропускной способности большой ждать не надо, но для небольшого клиентского ворклоада отлично подходит
источник

Д

Дмитрий in Data Engineers
Да как раз ждут от него хорошего ворклоада, но я чуда не жду ....
источник

Д

Дмитрий in Data Engineers
Особено с ssl.
источник

AZ

Anton Zadorozhniy in Data Engineers
SSL надо на чём-то нормальном терминировать
источник

Д

Дмитрий in Data Engineers
Таки да ....
источник

E

Evgeny in Data Engineers
Anton Zadorozhniy
Скорости или пропускной способности большой ждать не надо, но для небольшого клиентского ворклоада отлично подходит
Он вполне хорошо масштабируется. На тестах гигабит в лёгкую прокачивает
источник