Size: a a a

2021 September 16

ЕГ

Евгений Глотов... in Data Engineers
С оконками обидно кстати
источник

ЕГ

Евгений Глотов... in Data Engineers
Надо проверить, третий поумнел ли
источник

ЕГ

Евгений Глотов... in Data Engineers
Или делает 30 окон последовательно
источник

ЕГ

Евгений Глотов... in Data Engineers
Из-за этого мне даже имплисит класс пришлось написать
источник

ЕГ

Евгений Глотов... in Data Engineers
Типа df.withColumns(col(...), col(...), ...)
источник

ЕГ

Евгений Глотов... in Data Engineers
А там внутри селект)
источник

ИК

Иван Калининский... in Data Engineers
Нет ведь чтобы .selectExpr("*", "... over... ") и вперёд без всяких имплиситов. В питоняше нет имплиситов и никто не жалуется хД
источник

ЕГ

Евгений Глотов... in Data Engineers
А вроде звёздочка не заработала у меня(
источник

ИК

Иван Калининский... in Data Engineers
Оу, обидна
источник

ЕГ

Евгений Глотов... in Data Engineers
Ну и это, уровень скалы был увеличен)
источник

ЕГ

Евгений Глотов... in Data Engineers
Полезным образом)
источник

ЕГ

Евгений Глотов... in Data Engineers
А не как обычно
источник

ЕГ

Евгений Глотов... in Data Engineers
Мы кстати потом задумались и распихали по имплиситам куски бизнес-логики
источник

ЕГ

Евгений Глотов... in Data Engineers
А в основном коде бизнес-логики только крупные функции-блоки
источник

ЕГ

Евгений Глотов... in Data Engineers
Типа df
.makeSomeColumns()
.transformTimestamps()
.calcWindowFunctions()
.save()
источник
2021 September 17

OI

Oleg Ilinsky in Data Engineers
Спасибо!!
Ну в граф плане проджект один, но я думал, мб он на картинке всё группирует
источник

OI

Oleg Ilinsky in Data Engineers
Т.е. большой разницы не будет, захерачить 70 with column или один selectExpr?
источник

ИК

Иван Калининский... in Data Engineers
Я раньше, когда надо было добавить поля, не парясь делал foldLeft коллекции новых и оборачивал старые датафреймы в n полей. Ни разу не было проблем и чистый функциональный код
источник

ИК

Иван Калининский... in Data Engineers
источник

OI

Oleg Ilinsky in Data Engineers
А такой вопрос ещё: спарковый оптимизатор то, наверное, какое-то время должен потратить, чтобы соптимизировать кучу withColumn’ов в один project. Ну и на 10-20 это, наверное, не будет заметно, но насчёт 100+ я чота не уверен.
источник