Телеграмм чат группы hadoopusers страница 2694

причем в этом же чате было обсуждение что скачать по быстрому на hdfs один раз и запустить множество проходов оказывается в разы быстрее чем гонять по s3 каждый проход

источник

16:57пожаловаться #9

ИК

Иван Калининский... in Data Engineers

Andrey Smirnov

а зачем так много памяти, если все должно уйти на экзекуютеры

Затем, что экзекуторы отправляют информацию о результате на драйвер, всегда так было, кроме того «много» - понятие относительное, кому и 64 Гб на драйвере - только для проверки, на пром будет больше 100

источник

16:58пожаловаться #10

KrivdaTheTriewe in Data Engineers

Alex

да можно так сделать то

источник

17:00пожаловаться #11

KrivdaTheTriewe in Data Engineers

причем можно просто заперситить на дисках спакровых

источник

17:01пожаловаться #12

KrivdaTheTriewe in Data Engineers

и будет точно такая же логика, но в несколько десятков строчек, которую сможет прочитать любой человек пишущий на спарке

источник

17:01пожаловаться #13

Alexey Evdokimov in Data Engineers

пугает меня такой фанатизм в людях.

btw, 90% "стандартных" методов становятся таковыми по случайности, а не потому что лучше продуманы. кто первее и громче, того и шляпа. и на долю анонимусов из интернета достаётся вечное бодание с кривдами, которые во всём хотят видеть "стандартный способ". такая инверсия 'not invented here' синдрома

источник

17:20пожаловаться #14

Alexey Evdokimov in Data Engineers

понимаю, почему. но не поддерживаю.

источник

17:21пожаловаться #15

Alexey Evdokimov in Data Engineers

опять же btw, я 15 лет занимаюсь ревью кода джунов, и мне код анонимуса из интернетов не страшен. я врублюсь, если надо. даже если он левой задней ногой написан. и извлеку рациональ, если она там есть.

источник

17:22пожаловаться #16

Anton Zadorozhniy in Data Engineers

Alexey Evdokimov

дистцп — тормознутое говно, написанное кем-то не сильно трезвым в тёмную октябрьскую ночь

а есть ссылка на ваш PR который правит эти проблемы?

источник

18:10пожаловаться #17

Алексей in Data Engineers

Подскажите по Future, если часть из них упала с exception, то как их разделить на 2 кучки: удачные и ошибки?

val res = dbs.map(db => Future( ... ) )
val reswt = Future.sequence(res)
Await.result(reswt, scala.concurrent.duration.Duration.Inf)
res

.filter(???)

источник

18:12пожаловаться #18

Grigory Pomadchin in Data Engineers

Алексей

Подскажите по Future, если часть из них упала с exception, то как их разделить на 2 кучки: удачные и ошибки?

val res = dbs.map(db => Future( ... ) )
val reswt = Future.sequence(res)
Await.result(reswt, scala.concurrent.duration.Duration.Inf)
res

.filter(???)

Future.sequence(res.map(_.transform(Success(_))))

источник

18:14пожаловаться #19

Grigory Pomadchin in Data Engineers

Future.transform посмотри

источник

18:14пожаловаться #20