Size: a a a

2020 September 29

EV

Eduard Vlasov in Data Engineers
ога :)
источник

AZ

Anton Zadorozhniy in Data Engineers
более того, в зависимости от дистрибутива у вас могут быть всякие плюшки вроде вытягивания статистики, имперсонации пользователей и прочая чего нету в спарке (и врядли будет, другое целеполагание)
источник

SS

Sergey Sheremeta in Data Engineers
Anton Zadorozhniy
более того, в зависимости от дистрибутива у вас могут быть всякие плюшки вроде вытягивания статистики, имперсонации пользователей и прочая чего нету в спарке (и врядли будет, другое целеполагание)
я что-то затупил и не отсайзил отдельный кластер под Presto... его можно держать рядом с YARN?
источник

AZ

Anton Zadorozhniy in Data Engineers
Sergey Sheremeta
я что-то затупил и не отсайзил отдельный кластер под Presto... его можно держать рядом с YARN?
раньше запускали слайдером, но это не рекомендуемый подход; лучше всего отдельными процессами, или оператор на кубере
источник

EV

Eduard Vlasov in Data Engineers
есть еще presto on spark но я не тестил
источник

AZ

Anton Zadorozhniy in Data Engineers
наверное можно докером под ярн, но я такого в дикой природе не встречал
источник

DZ

Dmitry Zuev in Data Engineers
Anton Zadorozhniy
раньше запускали слайдером, но это не рекомендуемый подход; лучше всего отдельными процессами, или оператор на кубере
Есть оператор?
источник

AZ

Anton Zadorozhniy in Data Engineers
Dmitry Zuev
Есть оператор?
у старберста, да
источник

AZ

Anton Zadorozhniy in Data Engineers
работает неплохо но пока в начале пути, по-моему они IAM пока нормально на AWS не поддерживают, и какие-то там были косяки при дружбе с автоскейлером
источник

UD

Uncel Duk in Data Engineers
Sergey Sheremeta
я что-то затупил и не отсайзил отдельный кластер под Presto... его можно держать рядом с YARN?
дешево и сердито отрезать эти ресуры от ярна
источник

AZ

Anton Zadorozhniy in Data Engineers
на GKE лучше всего работает, они под гугл разрабатывали его прежде всего
источник

UD

Uncel Duk in Data Engineers
пока сайзите отдельный кластер для престы/патчите престу под yarn services
источник

DZ

Dmitry Zuev in Data Engineers
Anton Zadorozhniy
на GKE лучше всего работает, они под гугл разрабатывали его прежде всего
А что конкретно?
источник

AZ

Anton Zadorozhniy in Data Engineers
если вы его именно как федеративный используете то какой смысл его с ярном связывать, запускайте просто на пачке узлов где-то в сторонке, или на кубере
источник

AZ

Anton Zadorozhniy in Data Engineers
Dmitry Zuev
А что конкретно?
в маркетплейсе они вроде появились первыми на гугле, что-то еще было..
источник

AZ

Anton Zadorozhniy in Data Engineers
давно не заглядывал, думаю там все должно быть нормально на всех облаках и опеншифте сейчас
источник

AZ

Anton Zadorozhniy in Data Engineers
из хорошего там еще есть дельталейк и айсберг коннекторы
источник

SS

Sergey Sheremeta in Data Engineers
Anton Zadorozhniy
из хорошего там еще есть дельталейк и айсберг коннекторы
и Hudi-плагин?
источник

AT

Al T in Data Engineers
Anton Zadorozhniy
из хорошего там еще есть дельталейк и айсберг коннекторы
редшифт теперь может из дельталейка и худи читать кстати - жив, курилка )
источник

AZ

Anton Zadorozhniy in Data Engineers
Al T
редшифт теперь может из дельталейка и худи читать кстати - жив, курилка )
о, надо посмотреть как у них metadata handling сделан, сколько они планируют запрос из 10К файлов
источник