Size: a a a

2019 November 07

SB

Sergey Buyalsky in Data Engineers
Oleg Ilinsky
люблю этот чат за аргументированные споры)
он на аргументы не ведется
источник

VE

Vladimir E. in Data Engineers
кажется что в дата менеджменте кубер это вообще не про релизы, а про изоляцию, скейлинг и ML
источник

VE

Vladimir E. in Data Engineers
то есть как хадуп но лучше
источник

VE

Vladimir E. in Data Engineers
и мультклауд ещё в придачу
источник

N

Nikita Blagodarnyy in Data Engineers
Vladimir E.
Клаудера же ещё сделала импалу и hive LLAP на кубере 🤣
Боже, кто-то пользуется LLAP?
источник

VE

Vladimir E. in Data Engineers
хочешь запускай на гугле, хочешь - азур. Надоело, всё вернул он прем
источник

VE

Vladimir E. in Data Engineers
Nikita Blagodarnyy
Боже, кто-то пользуется LLAP?
ну у них же куча кастомеров, уверен что ктот да пользуется.
Они вообще когда показали что они практически все технологии в себя вобрали, я засомневался а смогут ли они вообще это всё тянуть вместе
источник

A

Alex in Data Engineers
Vladimir E.
то есть как хадуп но лучше
ну у них немного разные задачи как по мне

никто не запускает сервисы в хадупе
ну и в вычислительные по объему перемалываемых данных в хадупе получше (hbase на hdfs-локальных дисках будет быстрее чем если еще один уровень с мэпингом этих дисков в remote storage через пачку прослоек рулить)
источник

VE

Vladimir E. in Data Engineers
ну hbase да, я например про sql энджины (престо) и спарки
источник

VE

Vladimir E. in Data Engineers
и DS вский на пайтоне
источник

A

Alex in Data Engineers
престо не знаю
spark умеет и по сравнению с s3 есть фидбек что с hdfs он заметно шустрее
источник

VE

Vladimir E. in Data Engineers
да этож не только скорость важна,
у нас есть заказчик который сидит со spark 2.2
источник

VE

Vladimir E. in Data Engineers
уже на кучу багов натолкнулись
источник

VE

Vladimir E. in Data Engineers
а апгрейднуть - никак
источник

СХ

Старый Хрыч in Data Engineers
Vladimir E.
хочешь запускай на гугле, хочешь - азур. Надоело, всё вернул он прем
не всё так просто, например докер не может кучу параметров ядра, особенно связанных с выделением кешей и размеров их, в итоге потом читаешь как некоторые кадры засунули в кубер монги\кассандры\гринпламы\пг и там же сервисы, а потом бах, смена всего отдела девупсов
источник

VE

Vladimir E. in Data Engineers
с кубером теоретически бы таких проблем не было, так как спарк можешь какой хочешь использовать
источник

VE

Vladimir E. in Data Engineers
Старый Хрыч
не всё так просто, например докер не может кучу параметров ядра, особенно связанных с выделением кешей и размеров их, в итоге потом читаешь как некоторые кадры засунули в кубер монги\кассандры\гринпламы\пг и там же сервисы, а потом бах, смена всего отдела девупсов
ну всё как у всех хайповых технологий, давайте ВСЁ ВСЁ ТУДА ПЕРЕНЕСЁМ, конечно это остынет неможко
источник

VE

Vladimir E. in Data Engineers
думаю с хадупом тоже так было
источник

A

Alex in Data Engineers
не понимать
что мешает вам запускать любой спарк на хадупе
источник

UD

Uncel Duk in Data Engineers
Vladimir E.
а апгрейднуть - никак
Чет сложно
источник