Можно ли как-то сравнить расход памяти при разных запросах в спарке?
Сегодня вылезла ошибка что закончилось место на диске из-за spill, и я обнаружил, что коллега разворачивает запрос с помощью window functions (для выделения записей с максимальным timestamp), что скорее всего и съедает все ресурсы. Я помню, что можно достичь того же результата без оконных функций и расход памяти будет значительно меньше. Вот сейчас думаю как же всё это измерить и сравнить.