Size: a a a

2019 November 05

VE

Vladimir E. in Data Engineers
Просто у нас есть rest API сервер который запускает Спарк таски, и к нему обращаются много машин
источник

AZ

Anton Zadorozhniy in Data Engineers
научите его работать с AWS API
источник

VE

Vladimir E. in Data Engineers
Много времени, надо сейчас 😁
источник

VE

Vladimir E. in Data Engineers
Но спасибо за совет, подумаем над этим
источник

AZ

Anton Zadorozhniy in Data Engineers
судя по вопросам вы относитесь к EMR кластерам как к персистент железкам, как будто оно он-премис, просто взгляните на задачу как если эти кластера просто промежуточный шаг работы джоба, будет проще
источник

AZ

Anton Zadorozhniy in Data Engineers
плюс получите возможности вроде отложенного запуска на спотовых инстансах
источник

EV

Eduard Vlasov in Data Engineers
Vladimir E.
Просто у нас есть rest API сервер который запускает Спарк таски, и к нему обращаются много машин
я заюзал livy, полет нормальный
источник

VE

Vladimir E. in Data Engineers
Anton Zadorozhniy
судя по вопросам вы относитесь к EMR кластерам как к персистент железкам, как будто оно он-премис, просто взгляните на задачу как если эти кластера просто промежуточный шаг работы джоба, будет проще
Есть такое, пытаемся адаптировать существующую логику для он према для ЕМР.
Поэтому и думали делать edge node который бы сам работал со всеми EMR кластерами, мы бы ему только конфиги меняли
источник

AZ

Anton Zadorozhniy in Data Engineers
Vladimir E.
Есть такое, пытаемся адаптировать существующую логику для он према для ЕМР.
Поэтому и думали делать edge node который бы сам работал со всеми EMR кластерами, мы бы ему только конфиги меняли
кмк так себе решение, там еще с сетью и безопасностью будут проблемы, оно хотя бы к одному КДЦ цепляется?
источник

VE

Vladimir E. in Data Engineers
Так у ЕМР же нет KDC (kerberos), или я чего-то не пойму?
источник

EV

Eduard Vlasov in Data Engineers
есть
источник

EV

Eduard Vlasov in Data Engineers
надо security configuration настроить
источник

EV

Eduard Vlasov in Data Engineers
и внешний сервер KDC и чего нибудь там еще
источник

EV

Eduard Vlasov in Data Engineers
источник

VE

Vladimir E. in Data Engineers
ага, чёт я пропустил, спасибо!
источник

VE

Vladimir E. in Data Engineers
но вроде пока KDC не нужен
источник

VE

Vladimir E. in Data Engineers
так а всё таки, edge node для спарка с ЕМР не особо практикуется значит?
источник

EV

Eduard Vlasov in Data Engineers
а пошто
источник

VE

Vladimir E. in Data Engineers
ну вот как у меня юс кейс :D
нужная независимая машина откуда запускаются spark-submit
источник

VE

Vladimir E. in Data Engineers
понимаю что не правильно подходим к проблеме
источник