
Python — преобладающий язык программирования в машинном обучении. В целом можно найти всё и на других языках, но, согласно статистике, большая часть сообщества предпочитает Python.
Python — один из самых быстроразвивающихся языков, и именно на нём построен целый экомир Data Scientist.
Зачастую на собеседованиях можно встретить вопросы по следующим библиотекам:
— NumPy;
— SciPy;
— Pandas;
— Scikit-learn;
— Matplotlib/Seaborn;
— NLTK.
Есть достаточно много сайтов с курсами, но наиболее удачные, на мой взгляд, можно найти на Datacamp. Прелесть этого ресурса в том, что вы можете подобрать материал нужного вам уровня. Порог вхождения может быть достаточно низкий и подразумевать, что вы ничего не знаете о программировании в целом.
Из книг достаточно сложно что-то посоветовать, но на моем рабочем столе их две:
— Wes McKinney, «Python for Data Analysis»;
— Francisko Blanko, «Learning SciPy for Numerical and Scientific Computing».