У меня есть знакомые на должностях аналитиков в банках и там как раз такой подход работает R+SQL + пара классических подходов и их реальные задачи решаются. Достиг требуемого уровня и в продакшн. Но это специфика данных, что особо не меняются (работа не творческая).
Вот как раз на этой мысли и будет разница между человеком, что пишет парсеры по 5 долларов и по 50 долларов, но в час. Есть пласт очень непростых задач куда и nltk и ML можно прикрутить и все ещё будет парсингом.
Ну вот глазами клиента на выходе такая же табличка, но поля не по тегам на странице тянуть надо и не на одном сайте, а на нескольких тысячах сайтов и вычленять из полотен текста. Абсолютно реальная задача, что началась с "нужен список сайтов вузов" и затянулась на месяцы.
Их там 1.5млрд. Часть потянут. Не стоит всех под одну гребёнку только по стране происхождения. Опять же умение продать себя и реальный опыт за плечами.