Size: a a a

2019 November 07

A

Alex in Data Engineers
сам хадуп на 8ке до сих пор
а вот как таски запускать это уже отдельная тема
источник

В

Вадим in Data Engineers
Anton Zadorozhniy
будет больно и дорого (гугл не хочет чтобы вы съезжали), лучший способ который мне известен - экспорт в авро в GCS и уже забирать оттуда
Антон, спасибо. Погуглю в это сторону
источник

ЕГ

Евгений Глотов in Data Engineers
Vladimir E.
Клаудера же ещё сделала импалу и hive LLAP на кубере 🤣
Ллап и так не работает, а тут ещё и в кубере?)
источник

VE

Vladimir E. in Data Engineers
Евгений Глотов
Ллап и так не работает, а тут ещё и в кубере?)
а кстати какой вообще фидбек на Spark Warehouse connector и ACID в целом?
источник

VE

Vladimir E. in Data Engineers
работает или так се?
источник

N

Nikita Blagodarnyy in Data Engineers
Vladimir E.
Я просто вендор/пресейлс консультант, и у нас нет возможности сказать заказчику что им другая джава нужна
А где, если не секрет?
источник

VE

Vladimir E. in Data Engineers
Nikita Blagodarnyy
А где, если не секрет?
писал уже тут, Ataccama - это чешская фирма для Data Governance/Data Quality/MDM, если кратко то типа чтот вроде информатики или таленда. В основном на америку работаем, но и в России есть бизнес и офис
источник

СХ

Старый Хрыч in Data Engineers
Vladimir E.
Я просто вендор/пресейлс консультант, и у нас нет возможности сказать заказчику что им другая джава нужна
почему?
источник

ЕГ

Евгений Глотов in Data Engineers
Vladimir E.
работает или так се?
Поговаривают, что так себе, лично именно коннектор не юзал, но на 2 хайве спарк-ллап был кривой
источник

ЕГ

Евгений Глотов in Data Engineers
Но сама идея, что читать данные будет хайв, так себе
источник

ЕГ

Евгений Глотов in Data Engineers
Была б моя воля, мы бы у себя хайв вообще выкинули
источник

ЕГ

Евгений Глотов in Data Engineers
Раз уж теперь спарк и хайв разделены)
источник

VE

Vladimir E. in Data Engineers
ну мы приезжаем на две недели, пока добьёмся чтоб порты до датасорсов открыли, уже неделя пройдёт. С Хадуп тимом тоже обычно комуникация очень медленно происходит
источник

СХ

Старый Хрыч in Data Engineers
Vladimir E.
ну мы приезжаем на две недели, пока добьёмся чтоб порты до датасорсов открыли, уже неделя пройдёт. С Хадуп тимом тоже обычно комуникация очень медленно происходит
azul jvm смотрели?
источник

VE

Vladimir E. in Data Engineers
ща посмотрю
источник

СХ

Старый Хрыч in Data Engineers
я ей кучу гемора на кассандре решил
источник

VE

Vladimir E. in Data Engineers
а как вообще сказать спарку чтоб он другую jvm использовать на воркер нодах?
источник

СХ

Старый Хрыч in Data Engineers
Vladimir E.
а как вообще сказать спарку чтоб он другую jvm использовать на воркер нодах?
спарк запускается когда указываешь другую версию jvm в дефолте
источник

UD

Uncel Duk in Data Engineers
Старый Хрыч
azul jvm смотрели?
бохато
источник

VE

Vladimir E. in Data Engineers
слушайте, а вот у AWS есть Crawler  который ходит и ищет файлы по S3 и добавляет метаданные в Glue Data Catalog, а есть чтот подобное для Hadoop/HDFS?
источник