Евгений Глотов
Я с одним несложным патчем, включающим пайспарк виртуалэнв, гемора словил достаточно)
О, вспоминаю как у них реализован был install_package
Создаём рдд пустой
Репартишен на количество воркеров
В mapPartition вызываем pip install
Мы же верим что при параллелизации каждая партиция попадёт на свой воркер