Кхм... Я может не очень шарю, но датасайнс - это в целом все препроцессинг))
Depends. Дата сайенс разнообразен сильно. У меня 10 человек в отделе - все дата сайенс. Но примерно 8 я не смогу заменить, они умеют и делают совсем другое чем я - кто картинки, кто байеса, кто параллелизацию симуляций, кто хитрый стык статистики и ML. Ну если сяду на месяц-два только ботать, то да, но сходу точно нет. Я-то кручу-верчу фичи и всякую прикладную аналитику-мелкое моделирование. Data wrangling, data cleaning, data QC (натурально, был пациент, который два раза умер).