Слушайте, а есть тут желающие в датаинженерство? У меня есть ряд интересных задач, где и в данных надо покопаться, и модельки потренировать, и код (на СКАЛЕ) пописать неодноразовый. Самое хорошее - что задачи разноплановые и очень практические - тут тебе и кластеризация объектов, и антифрод, и поиск коррелирующих событий в независимых потоках данных.
Но работать в Яндексе придётся, конечно. :)
Мне казалось, что кластеризация и обучения это не дата инженеринг