Size: a a a

2020 December 08

K

KrivdaTheTriewe in Data Engineers
ну потому что удобнее мавена, нативный для scala прилаг, куча плагинов нужных
источник

GP

Grigory Pomadchin in Data Engineers
он порсто дефолт паралелизм ставит на x2 доступных cpu (ну и по памяти там чет ставит еще; не оч полезная фича оч большой мизюз)
источник

AE

Alexey Evdokimov in Data Engineers
куча мелочей, размазанных по всему конвейеру, 5 дней потратил чтобы полностью всё отладить
источник

GP

Grigory Pomadchin in Data Engineers
Grigory Pomadchin
он порсто дефолт паралелизм ставит на x2 доступных cpu (ну и по памяти там чет ставит еще; не оч полезная фича оч большой мизюз)
это ж полная жесть
потеницально операиця которая хотела презервить партишены будет решафлена в этот паралелизм
источник

AE

Alexey Evdokimov in Data Engineers
Grigory Pomadchin
он порсто дефолт паралелизм ставит на x2 доступных cpu (ну и по памяти там чет ставит еще; не оч полезная фича оч большой мизюз)
в 5 ветке емр он возвращал x2 CPU, да. в шестой только если maxResourceAllocation а эт офлаг который на ноде оставляет 1 жирный экзекутор на все ядра и всю память
источник

AE

Alexey Evdokimov in Data Engineers
вот зачем они это сделали
источник

Igor  Master in Data Engineers
KrivdaTheTriewe
ну потому что удобнее мавена, нативный для scala прилаг, куча плагинов нужных
мне мавен удобнее, я раз попытался scope на sbt для uber-jar настроить и забил.
источник

GP

Grigory Pomadchin in Data Engineers
Igor  Master
почему?
да мавен динозавр из прошлого) что угодно лучше чем мвн
но это холиварный вопрос ж
хоть javacом собирай если нравится
источник

Igor  Master in Data Engineers
ant'ом же
источник

Igor  Master in Data Engineers
Почему то sbt у меня тянул все на свете со в скопе provided
источник

GP

Grigory Pomadchin in Data Engineers
Igor  Master
Почему то sbt у меня тянул все на свете со в скопе provided
такое не мож быть
источник

GP

Grigory Pomadchin in Data Engineers
баг или что-то еще тянуло
источник

AE

Alexey Evdokimov in Data Engineers
чё касается зависимостей в 6 ЕМРе, то там даже гуава у ихней сборки спарка и хадупа разная. пока 20-ю не пропишешь явно, конфликт в рантайме, если не дай бог что из неё заюзал у себя
источник

AE

Alexey Evdokimov in Data Engineers
либо импортить из org.apache.sparkproject.guava. что несколько некошерно
источник

Igor  Master in Data Engineers
Ох я бы с упоением почитал бы статейку на тему что надо доделать напильником в спарк 3.0
источник

K

KrivdaTheTriewe in Data Engineers
Alexey Evdokimov
чё касается зависимостей в 6 ЕМРе, то там даже гуава у ихней сборки спарка и хадупа разная. пока 20-ю не пропишешь явно, конфликт в рантайме, если не дай бог что из неё заюзал у себя
можно еще зашейдить
источник

Igor  Master in Data Engineers
Grigory Pomadchin
баг или что-то еще тянуло
Когда в мавене фиганул provided поставил пару excludes на пакеты в плагины и вот джарка уже не 100 метров
источник

GP

Grigory Pomadchin in Data Engineers
Alexey Evdokimov
чё касается зависимостей в 6 ЕМРе, то там даже гуава у ихней сборки спарка и хадупа разная. пока 20-ю не пропишешь явно, конфликт в рантайме, если не дай бог что из неё заюзал у себя
не понял; если у себя используешь шейди (это _правильно_) менять в рантайме это надеяться на то что не стрельнет в колено
источник

AE

Alexey Evdokimov in Data Engineers
KrivdaTheTriewe
можно еще зашейдить
тогда в фатжаре будет три копии гуавы :/
источник

Igor  Master in Data Engineers
А на скала 2.12 тяжко переезжать с 2.11?
источник