Телеграмм чат группы hadoopusers страница 2554

вот я и думаю как можно через spark sql потюнить параллелизм

13:36пожаловаться #1

ну ретраи крутить на троттлинге глупо, т.к. увеличение только увеличит число запросов, а уменьшение увеличит вероятность падения

13:36пожаловаться #2

я бы число executors покрутил, уменьшил и посмотрел бы как файлики лежат

13:36пожаловаться #3

они все с одним префиксом?

13:36пожаловаться #4

нет, партиции по дням

13:37пожаловаться #5

ну и возможно техническая поддерка может просто throttling limit увеличить

13:37пожаловаться #6

Eduard Vlasov

нет, партиции по дням

тогда совсем странно

13:37пожаловаться #7

я наслышан о компетентности поддержки aws, но походу придется таки писать им

13:37пожаловаться #8

А много экезкьюторов, много тасков и как быстро они исполняются? Т.е. реально в эти 4Krps на бакет упираетесь?

13:39пожаловаться #9

40 машин 80 экзекуторов

13:40пожаловаться #10

тасков 1900 в этой джобе

13:40пожаловаться #11

у меня появилась идея задрать ретраи в небо и проверить чо будет

13:40пожаловаться #12

там же exponential backoff вроде как

13:40пожаловаться #13

Alexey Evdokimov in Data Engineers

Art

Texas, resolution 10, заняло ~5 минут. Такая ли проблема все таки?

ты нормальный аутлайн возьми, а не прямоугольник. несколько интереснее будет

13:54пожаловаться #14

Alexey Evdokimov in Data Engineers

Паша Финкельштейн

думается для маленьких стран легче понимать по стране. Вопрос что делать с фигнёй типа России, Канады, кто там ещё

в России мы только куски вокруг городов считаем, а то чё-то никто не живёт в стране у нас :)

13:56пожаловаться #15

Sergey Sheremeta in Data Engineers

коллеги, поделитесь бест-практиками по сведению в единый git-репозиторий всего кода ETL для spark и spark structured streaming...

15:05пожаловаться #16

Anton Zadorozhniy in Data Engineers

cp && git add . && git commit

15:05пожаловаться #17

Sergey Sheremeta in Data Engineers

чтобы там всякие деплойменты можно было запускать (обои менять, корованы грабить)

15:06пожаловаться #18

Sergey Sheremeta

Завели DBT для батчевых преобразований и радуемся

15:07пожаловаться #19

Anton Zadorozhniy

cp && git add . && git commit

git push —force