Size: a a a

Python для анализа данных

2018 December 26

AL

Aleksey Laptev in Python для анализа данных
в чем?
источник

b

bacchus in Python для анализа данных
в том что аналитикам нужно быстро код написать чтобы как можно быстрее выполнялись итерации верчения данных
источник

b

bacchus in Python для анализа данных
а разрабам на миллион лет стабильную приложуху
источник

b

bacchus in Python для анализа данных
из за этого и появился jupyter notebook
источник

АМ

Алексей Макаров... in Python для анализа данных
В том, что нужно итеративно выполнять последовательные участки кода и быстро видеть результат выполнения. При этом выполненная часть кода должна сохранять свои данные в environment, чтобы можно было к ней обратиться из другого участка кода. Желательно еще чтобы датафреймы рендерились и визуализации
источник

AL

Aleksey Laptev in Python для анализа данных
Ну как только количество последовательных участков код переполнит буфер аналитика, можно вернуться к вопросу о правильной структуре кода )
источник

b

bacchus in Python для анализа данных
эм
источник

b

bacchus in Python для анализа данных
ок)
источник

АМ

Алексей Макаров... in Python для анализа данных
Вообще, есть ощущение, что аналитики и правильная структура кода - это вещи немного несовместимые) Ни разу не видел, чтобы кто-то заморачивался, например, с классами в ноутбуках
источник

AL

Aleksey Laptev in Python для анализа данных
Ну тут нет смысла спорить, возрастающая сложность задач сама приведет к этому
источник

Y

Yuriy in Python для анализа данных
в машинном обучении имеет смысл
источник

Y

Yuriy in Python для анализа данных
аналитикам не особо
источник

АМ

Алексей Макаров... in Python для анализа данных
Ну и ещё прелесть ноутбуков в том, что по сути это полноценная воспроизводимое описание исследование или эксперимента. С маркдауном, визуализациями. Вот тут можно посмотреть на лучшие примеры: https://github.com/jupyter/jupyter/wiki/A-gallery-of-interesting-Jupyter-Notebooks
источник

AL

Aleksey Laptev in Python для анализа данных
Алексей Макаров
В том, что нужно итеративно выполнять последовательные участки кода и быстро видеть результат выполнения. При этом выполненная часть кода должна сохранять свои данные в environment, чтобы можно было к ней обратиться из другого участка кода. Желательно еще чтобы датафреймы рендерились и визуализации
а какие задачи решаются таким подходом?
источник

АМ

Алексей Макаров... in Python для анализа данных
Aleksey Laptev
а какие задачи решаются таким подходом?
а) Быстрое протипирование сподручных алгоритмов для какой-то автоматизации б) Алгоритмы анализа данных, когда не сразу очевидно, что нужно делать, а сначала нужно провести разведывательный анализ данных
источник

AL

Aleksey Laptev in Python для анализа данных
Из практики есть кейсы?
источник

AL

Aleksey Laptev in Python для анализа данных
Что лично вы делали
источник

АМ

Алексей Макаров... in Python для анализа данных
Вытаскивание данных из различных API (Яндекс.Метрика, Google Analytics), добавление к этому данных из CRM (что требует муторной итеративной отладки в ходе сопоставления данных из двух источников) и затем подготовка отчетов в Excel. Это один из примеров
источник

AL

Aleksey Laptev in Python для анализа данных
И все эти данные в энвайроменте а не бд?
источник

АМ

Алексей Макаров... in Python для анализа данных
Да
источник