Size: a a a

2021 October 25

OI

Oleg Ivchenko in Data Engineers
Т.е. MR здесь нужен чтоб погрузиться в детали
источник

AE

Alexey Evdokimov in Data Engineers
вопрос зачем, то есть нафига
источник

N

Nikolay in Data Engineers
в спарке так же можно расписать. почему нет?
источник

A

Alex in Data Engineers
то есть? всё равно условный mr под капотом везде, что в спарке, что в игнайт, что даже в той же терадате

правда отдельные этапы могут пропускаться или объединяться
но сама логика остаётся той же

поэтому если занимаешься распределёнными вычислениями то считаю что желательно знать чем тот же бродкасть от сортед или дистхэшджойна отличается
источник

AE

Alexey Evdokimov in Data Engineers
и в спарке можно на разных уровнях расписать. и кажется это будет полезнее
источник

OI

Oleg Ivchenko in Data Engineers
В RDD API вроде бы нельзя залезть во внутренности join'а?
источник

OI

Oleg Ivchenko in Data Engineers
в DF тем более
источник

N

Nikita Blagodarnyy in Data Engineers
ну подсказать-то можно, типа попользуй вот тут броадскаст джойн
источник

N

Nikita Blagodarnyy in Data Engineers
где-то заплакали одни одноклассники
источник

AK

Alex K in Data Engineers
ребят, пытаюсь разобраться в workflow и coordinator oozie и что-то сложно. Может пооветуете на русском что-нить
источник

AE

Alexey Evdokimov in Data Engineers
ну спарковый джойн это cogroup. как минимум партишионером в него сунуть можно
источник

t

tenKe in Data Engineers
в каком смысле?
источник

AE

Alexey Evdokimov in Data Engineers
под ним уже developerapi, но покопаться всё равно можно. а при желании и свой написать
источник

OI

Oleg Ivchenko in Data Engineers
Это не так эффективно всё же, как разобрать код Join'а в мапредьюсе мне каж
источник

D

Dmitry in Data Engineers
и какая цель ? убедить новичка что тут все через жопу и намекнуть что пока не освоишь все костыли, хрен поймешь как это работает ?
источник

N

Nikolay in Data Engineers
вы можете разобрать код джойна в спарке и люди будут рименять эти знания на практике
источник

A

Alex in Data Engineers
не будут
источник

AE

Alexey Evdokimov in Data Engineers
пока новичок не напишет свой Map и List, хрен его научишь понимать как работают стандартные коллекции
источник

A

Alex in Data Engineers
потому что людей которые видели код спарка единицы
плюс вы зачастую не знаете какой там джойн влетить, особенно после мержа всех адаптив патчей
источник

A

Alex in Data Engineers
а вот читать потом план выполнения да, уже будет полезным понимать что как
источник