Size: a a a

2021 September 16

KS

K S in Data Engineers
Можно поподробнее?
Это минимальная часть на питоне и сохранять всё в Постгрес?
источник

AE

Alexey Evdokimov in Data Engineers
у типичного инженера основной кейс обычно сводится к "тем или иным способом снизить издержки" %)
источник

AE

Alexey Evdokimov in Data Engineers
а поддержка чего-либо всегда самое дорогое, потому что стоит больше всего человеческого времени
источник

AE

Alexey Evdokimov in Data Engineers
отличная статья. сохранил в закладочки
источник

AZ

Anton Zadorozhniy in Data Engineers
Если у вас такой маленький объём то я бы посмотрел на встроенные базы, duckdb например
источник

M

Mikhail in Data Engineers
Ксю не хватило маркус стула...
источник

ПФ

Паша Финкельштейн... in Data Engineers
ахах
источник

T

T in Data Engineers
Бери zig
источник

KS

K S in Data Engineers
Спасибо всем за информацию, буду изучать.
источник

OI

Oleg Ilinsky in Data Engineers
Скромный up
источник

T

T in Data Engineers
источник

GP

Grigory Pomadchin in Data Engineers
sps
источник

ЕГ

Евгений Глотов... in Data Engineers
Так он и во втором не превращается
источник

ЕГ

Евгений Глотов... in Data Engineers
Я чё зря штоле проверял тут неделю назад
источник

ЕГ

Евгений Глотов... in Data Engineers
Если у вас сложный withColumn, например с оконочкой, то конечно будет stage
источник

ЕГ

Евгений Глотов... in Data Engineers
А так, по крайней мере spark 2.4.5, несколько withColumn и даже более сложные операции разворачивает в один project
источник

ЕГ

Евгений Глотов... in Data Engineers
С оконками - нужно делать select(*all_columns, func1().over(w), func2().over(w), ...)
источник

ЕГ

Евгений Глотов... in Data Engineers
Тогда если окно одно или даже просто есть у них общий partitionBy - исполнится в одну стадию
источник

ПФ

Паша Финкельштейн... in Data Engineers
Людей, которые были свидетелями минимум :)
источник

ПФ

Паша Финкельштейн... in Data Engineers
Но я помню!
источник