Size: a a a

2021 March 30

A

Alex in Data Engineers
5-10 патчей без проблем ребейзятся/мержутся при выходе новой версии и собирается что тебе нужно
источник

A

Alex in Data Engineers
а вот если полноценный форк, то там да, проблем с мержами может быть много
источник

AE

Alexey Evdokimov in Data Engineers
ну у третьей ветки я не смотрел код, если что. может попроще стало, но во втором зоопарк такой, что страшно соваться
источник

AZ

Anton Zadorozhniy in Data Engineers
Я делал кастомный датасорс на мастере до релиза тройки, ну день в пару недель тратишь на мерджи, жить можно
источник

AE

Alexey Evdokimov in Data Engineers
это если уже знаешь где %)
а если с нуля решишься полезть, не поседеешь?
источник

A

Alex in Data Engineers
джависту в кодовой базе спарка норм, код достаточно адекватный
источник

AZ

Anton Zadorozhniy in Data Engineers
Ну это же не кампанейщина, ты поддерживаешь его какое-то время, или проектом или просто как работа
источник

AE

Alexey Evdokimov in Data Engineers
Alex
джависту в кодовой базе спарка норм, код достаточно адекватный
у самого спрка да, более менее. я про зависимости
источник

AZ

Anton Zadorozhniy in Data Engineers
Не думаю что кому-то стоит заходить туда ради одного патча, свой форк это большое решение
источник

K

KrivdaTheTriewe in Data Engineers
Anton Zadorozhniy
Я делал кастомный датасорс на мастере до релиза тройки, ну день в пару недель тратишь на мерджи, жить можно
кастомный датасорс можно в проекте положить
источник

A

Alex in Data Engineers
смотря какой это патч, иногда проще сразу в коде поправить дефолт значения
особенно если они не подразумевают конфигурируемости =\
источник

AE

Alexey Evdokimov in Data Engineers
мне вот лично буквально на той неделе потребовался джексон на одну минорку новее, чем в комплекте ванилы 3.0.
в фатджаре реплейснул, вроде всё работает. но гуаву или коммонсы так манкипатчить страшно.
источник

AE

Alexey Evdokimov in Data Engineers
в 2.4 оно шадовилось в org.spark_project
источник

AZ

Anton Zadorozhniy in Data Engineers
KrivdaTheTriewe
кастомный датасорс можно в проекте положить
там была идея в паре оптимизаций которые требовали измения датасорсв2 спеки в самом спарке
источник

A

Alex in Data Engineers
Alexey Evdokimov
мне вот лично буквально на той неделе потребовался джексон на одну минорку новее, чем в комплекте ванилы 3.0.
в фатджаре реплейснул, вроде всё работает. но гуаву или коммонсы так манкипатчить страшно.
гуаву не получится, она там в момент сборки jar шейдится
так что как вариант только ручками классы переименовывать
источник

AE

Alexey Evdokimov in Data Engineers
Alex
гуаву не получится, она там в момент сборки jar шейдится
так что как вариант только ручками классы переименовывать
угу. вот я тоже думал сфоркать спарк, потом посмотрел, и понял что в одно лицо я это не потяну. пришлось сторонние либы корёжить, там меньше работы
источник

ЕГ

Евгений Глотов... in Data Engineers
Я с одним несложным патчем, включающим пайспарк виртуалэнв, гемора словил достаточно)
источник

ЕГ

Евгений Глотов... in Data Engineers
А ведь он встроен в хдп)
источник

A

Alex in Data Engineers
их кастомными патчами 😉
источник

A

Alex in Data Engineers
apache
cloudera
hortonworks
intel-adaptive

в своё время были git remote когда в спарке ковырялся
источник