Size: a a a

Python для анализа данных

2021 March 31

AK

Alex K in Python для анализа данных
Короч делаю gridsearch в prophet и по прикидкам получается 43 часа. Мб каждый по отдельности для начала взять и не делать grid. А потом уже спаривать хорошие варианты. Или как обычно решается?
источник

AK

Alex K in Python для анализа данных
источник

PZ

Pavel Zheltouhov in Python для анализа данных
Alex K
Короч делаю gridsearch в prophet и по прикидкам получается 43 часа. Мб каждый по отдельности для начала взять и не делать grid. А потом уже спаривать хорошие варианты. Или как обычно решается?
ну там в документации написано мол, Fully automatic.
и это можно понять. ведь если на глаз аналитика не прослеживается сезонность,  то и gridsearch  найдет мусор
источник

AK

Alex K in Python для анализа данных
тип тюнить смысла нет?
источник

PZ

Pavel Zheltouhov in Python для анализа данных
Alex K
тип тюнить смысла нет?
насколько я понял типичные применение этой библиотеки, подбор параметров   не считается стандартным решением. ( но может ли одно мнение считаться экспертным консенсусом?)
если размышлять не по документации, должны быть применимы стандартные техники sklearn. у них же там несколько разных стратегий https://scikit-learn.org/stable/modules/grid_search.html#successive-halving-user-guide. осталось разобраться как их натянуть без собственно CV
источник

PZ

Pavel Zheltouhov in Python для анализа данных
Мне вообще интуитивно кажется что не стоит ни градиент, ни половинное деление изображать для этих алгоритмов. Только случайный поиск
(Но это из-за непонимания что там под капотом)
источник

AK

Alex K in Python для анализа данных
Pavel Zheltouhov
насколько я понял типичные применение этой библиотеки, подбор параметров   не считается стандартным решением. ( но может ли одно мнение считаться экспертным консенсусом?)
если размышлять не по документации, должны быть применимы стандартные техники sklearn. у них же там несколько разных стратегий https://scikit-learn.org/stable/modules/grid_search.html#successive-halving-user-guide. осталось разобраться как их натянуть без собственно CV
Понял, спасибо, буду изучать
источник

LK

Lyubov K. in Python для анализа данных
Yuriy Saraikin
Можете уточнить задачу, которую решаете?
Да, наверное действительно плохо задачу пояснила.

У меня есть набор id покупателей - 500000 уникальных значений

Из своих бд подтягиваю к эти id данные пол, возраст и тд. И  получается найти около 250 тыс.

Могу ли я по этим данным составить портрет покупателя. Пол, возраст.. или это будет неверно?
источник

A

Andrey Denisov in Python для анализа данных
Lyubov K.
Да, наверное действительно плохо задачу пояснила.

У меня есть набор id покупателей - 500000 уникальных значений

Из своих бд подтягиваю к эти id данные пол, возраст и тд. И  получается найти около 250 тыс.

Могу ли я по этим данным составить портрет покупателя. Пол, возраст.. или это будет неверно?
Статистический метод "в лоб" ничего не даст.
Тут больше бизнесовый вопрос. Можете по выручке\марже разбить на 2 группы - "с данными" и "без данных" и посмотреть пропорцию. И уже сверху смотреть через всякие парето и абц.

Изначально - если он у вас купил, то он точно ваш покупатель. Разложите по рфму - будут просто разные сегменты
источник

🅰

🅰️ртур in Python для анализа данных
Привет! Какую книгу по основам Python посоветуете? Сейчас в магазине, вижу такую:
источник

🅰

🅰️ртур in Python для анализа данных
источник

YS

Yuriy Saraikin in Python для анализа данных
Lyubov K.
Да, наверное действительно плохо задачу пояснила.

У меня есть набор id покупателей - 500000 уникальных значений

Из своих бд подтягиваю к эти id данные пол, возраст и тд. И  получается найти около 250 тыс.

Могу ли я по этим данным составить портрет покупателя. Пол, возраст.. или это будет неверно?
Поддержу @realdronos. Выборочный метод здесь не поможет. У него другое использование. Есть генсовокупность, по ней нужна какая-то информация. Вы из неё случайным образом делаете выборку и по выборке с определенной точностью делаете вывод по генсовокупности. Портрет составить можно, но он будет относится только к этим 250 тыс. Ну, или используйте предложения @realdronos
источник

P

Parθava in Python для анализа данных
🅰️ртур
Привет! Какую книгу по основам Python посоветуете? Сейчас в магазине, вижу такую:
лучше не брать книги
источник

P

Parθava in Python для анализа данных
а практиковать на реальных примерах
источник

MC

Makha Cloud in Python для анализа данных
Кто-то решал задачу оценки влияния дефицита товаров на продажи?
источник

АС

Алексей Сафонов... in Python для анализа данных
Parθava
а практиковать на реальных примерах
Если нет фундамента, например другой язык, желательно зрелый. КПД крайне маленькое будет от делать что-то на примерах + научиться всякому плохому в процессе можно, что потом изживать довольно долго придётся. Книги не панацея конечно, но хороший старт на долгом путь развития.
источник

AO

Andrey Ostrovsky in Python для анализа данных
🅰️ртур
Привет! Какую книгу по основам Python посоветуете? Сейчас в магазине, вижу такую:
Лутц
источник

P

Parθava in Python для анализа данных
Алексей Сафонов
Если нет фундамента, например другой язык, желательно зрелый. КПД крайне маленькое будет от делать что-то на примерах + научиться всякому плохому в процессе можно, что потом изживать довольно долго придётся. Книги не панацея конечно, но хороший старт на долгом путь развития.
отнюдь нет, к сожалению. У книг очень много проблем, которые они могут дать на старте. Например, ты никогда не знаешь, насколько хорошо ты закрепил материал. Я в свое время читал так лутца и думал, что вполне себе хорошо понял работу словарей и генератов. А потом бац, реальный кейс - и все, понял что ничего не понял
источник

🅰

🅰️ртур in Python для анализа данных
Спасибо, именно ее все посоветовали.
источник

AO

Andrey Ostrovsky in Python для анализа данных
Если нравится в целом книжный формат. Он прям с нуля рассказывает и даже идеологически по ходу подпитывает) мне зашло)
источник