Size: a a a

2021 September 23

ЕГ

Евгений Глотов... in Data Engineers
источник

OI

Oleg Ilinsky in Data Engineers
да, эт понятно
потом union
источник

OI

Oleg Ilinsky in Data Engineers
EXCEPT and EXCEPT ALL return the rows that are found in one relation but not the other. EXCEPT (alternatively, EXCEPT DISTINCT) takes only distinct rows while EXCEPT ALL does not remove duplicates from the result rows. Note that MINUS is an alias for EXCEPT.
источник

OI

Oleg Ilinsky in Data Engineers
но чёт я не понимаю всё равно, как после except строк больше становится
источник

ЕГ

Евгений Глотов... in Data Engineers
Там джойн выполняется
источник

ЕГ

Евгений Глотов... in Data Engineers
Если строки не уникальны, то будет множиться
источник

OI

Oleg Ilinsky in Data Engineers
ну эт понятно, но тип выглядит как баг)
источник

ЕГ

Евгений Глотов... in Data Engineers
Это фича)
источник

ЕГ

Евгений Глотов... in Data Engineers
источник

OI

Oleg Ilinsky in Data Engineers
если сравнивать таблички с большим кол-вом дублей, можно вообще получить ООМы, получается
источник

OI

Oleg Ilinsky in Data Engineers
источник

ЕГ

Евгений Глотов... in Data Engineers
Spark.sql.shuffle.partitions увеличиваешь и норм
источник

ЕГ

Евгений Глотов... in Data Engineers
Одна партиция до 10млн строк переваривает +-
источник

OI

Oleg Ilinsky in Data Engineers
не, таких строк нет
источник

TG

Tony Gogin in Data Engineers
источник

OI

Oleg Ilinsky in Data Engineers
с работами не сюда
источник

OI

Oleg Ilinsky in Data Engineers
источник

TG

Tony Gogin in Data Engineers
Подскажи куда))
источник

OI

Oleg Ilinsky in Data Engineers
там выше скинул, там прям в канале будет висеть вакансия
здесь улетит за полчаса наверх
источник

TG

Tony Gogin in Data Engineers
Спасиб)
источник