смотрите, вы написали целый проект, который копирует логику другого проекта, в котором захардкожено куча всего , вы экономите деньги заказчику сейчас - но удорожаете поддержку этого кода вашей фирме, потому что еще одному человеку придется разбираться с нестандартными компонентами, при этом для другого заказчика придется писать цсв с другими разделителями,а не стнадратные, которые захордкожены, поэтому кономика мне не понятна. При этом можно было решить задачу в 50-100 строчек на питоне + bash / java / scala и радоваться жизни не имея проседания.
Подойти допустим творчески и решить задачу в два этапа
dist cp + отдельная обработка на спарке по конвертации в файлы
сразу сделать на спарке все