Size: a a a

2021 April 21

GP

Grigory Pomadchin in Data Engineers
к8с был экспериментальным в 2.4; сча уже достаточно широко используется
источник

S

Serg Slipushenko in Data Engineers
источник

GP

Grigory Pomadchin in Data Engineers
Та все лучше чем ярн знаешь ли
источник

GP

Grigory Pomadchin in Data Engineers
источник

PK

Pavel Klemenkov in Data Engineers
Я тоже не догоняю, а на дата локалити все уже болт забили? Или я чего-то не знаю?
источник

GP

Grigory Pomadchin in Data Engineers
О каком дата локалити ты говоришь если у тебя скажем условный с3 и кубер кластер в том же регионе
источник

S

Serg Slipushenko in Data Engineers
та я вспоминаю как мы несколько килобаксов сожгли на том что промахнулись с регионами в ажуре
источник

UD

Uncel Duk in Data Engineers
Дата локалити решается портами в 400г
источник

UD

Uncel Duk in Data Engineers
Которые у амазуна есть
источник

PK

Pavel Klemenkov in Data Engineers
Ну так я прро это вопрос и задаю. Дата локалити уже не модно? Т.е. вроде как мы еще год назад оптимизировали шаффлы, а теперь это не нужно?
источник

A

Alex in Data Engineers
просто возьми больше железа
источник

UD

Uncel Duk in Data Engineers
( на опремайзе максимум будет 25-40г с хоста )
источник

UD

Uncel Duk in Data Engineers
источник

D

Dmitry in Data Engineers
это деньги
источник

UD

Uncel Duk in Data Engineers
Деньги есть, железа тупо нет
источник

GP

Grigory Pomadchin in Data Engineers
Экстернал шафл сервис; ну если те так шафл нужен)
источник

PK

Pavel Klemenkov in Data Engineers
Так мне он не нужен, но спарк-то по другому не умеет.
источник

UR

Uncle Ruckus in Data Engineers
А можно для совсем диких6 а за что тут платят? Стендалонный кластер был всегда
https://spark.apache.org/docs/1.6.0/cluster-overview.html
источник

UR

Uncle Ruckus in Data Engineers
То что ноды в докер затащили это конечно зрада и пэрэмога, но кому деньги отдавать?
источник

D

Dmitry in Data Engineers
Read Operations** (every 4MB, per 10,000)
Write Operations* (every 4MB, per 10,000)
источник