Size: a a a

Python для анализа данных

2021 February 06

IS

Ivan Samorukov in Python для анализа данных
источник

AK

Aleksei Komissarov in Python для анализа данных
Aleksandr
код такой
data['purpose_lemma'] = data['purpose'].apply(m.lemmatize(''.join(data['purpose'])))
Как мы собираемся применить apply к data['purpose'], а потом, когда задаем фунцкию, что нам делать, отдельно туда пихаем ещё раз data['purpose']?
источник

AK

Aleksei Komissarov in Python для анализа данных
как аргумент у нас идет элемент из data['purpose'], и если мы будем делать через lambda x, то обозначаться это будет x. Если функция отдельная под это, то передаем название функции без этого аргумента.
источник

A

Aleksandr in Python для анализа данных
Получилось, спасибо всем, очень помогли!!)
источник

PZ

Pavel Zheltouhov in Python для анализа данных
Alex K
ну вот фиговые результаты получилиь во второй половине янваоя
О. Тут вспомнил как тут Пятерке два ящика угля лежит на самом видном месте с января. Не покупают. Кто ж предсказал такое?
источник

AZ

Arsenii Zed in Python для анализа данных
Pavel Zheltouhov
Короновирус - пример события которое ни одна модель не могла бы предсказать.
А как же копия мозга Билла Гейтса?)
источник

PZ

Pavel Zheltouhov in Python для анализа данных
А еще эта Пятерка НЕ на выезде из города. И тут в леске рядом в некотором смысле экологическая катастрофка произошла - шашлычки зимой уже не интересны. Короче, перестарался безызвестный питонист. Дал стране угля.

так много, что они его перед входом выложили.
источник
2021 February 07

СИ

Сергей Ильин... in Python для анализа данных
скажите, а в Plotly кто-нибудь с анимацией / слайдерами мучился? пару бы вопросов задать..
источник

AK

Alex K in Python для анализа данных
Сергей Ильин
скажите, а в Plotly кто-нибудь с анимацией / слайдерами мучился? пару бы вопросов задать..
мне кажется стоит сразу задать
источник

СИ

Сергей Ильин... in Python для анализа данных
Alex K
мне кажется стоит сразу задать
да там головняк чисто в коде, не хотел засорять чат.
источник

AK

Alex K in Python для анализа данных
Народ, вот есть такой объём ежемесячных продаж по товару.

Я уже писал здесь, но вопрос другой чем был. Повторю условия, чтоб напомнить. Бизнес хочет спрогнозировать ежедневные продажи с минимальной ошибкой.

Сейчас они используют что-то типа скользящего среднего. И ошибка около 15%. Они написали нейронку. Там например погода забита и тд, она показала себя не очень.  

Я нейронки вообще в глаза не видел, с классическим немного имел дело. У меня два варианта, либо отказаться совсем, либо попробовать XGBoost или что-то типа.

Внимание вопрос, правда ли что нейронка имеет лучшее применение на больших выборках, или это бред? И вообще насколько такая задача эффективно может решиться XGBoost или он вообще не конкурент DL
источник

ИК

Игорь Кудрешов... in Python для анализа данных
Alex K
Народ, вот есть такой объём ежемесячных продаж по товару.

Я уже писал здесь, но вопрос другой чем был. Повторю условия, чтоб напомнить. Бизнес хочет спрогнозировать ежедневные продажи с минимальной ошибкой.

Сейчас они используют что-то типа скользящего среднего. И ошибка около 15%. Они написали нейронку. Там например погода забита и тд, она показала себя не очень.  

Я нейронки вообще в глаза не видел, с классическим немного имел дело. У меня два варианта, либо отказаться совсем, либо попробовать XGBoost или что-то типа.

Внимание вопрос, правда ли что нейронка имеет лучшее применение на больших выборках, или это бред? И вообще насколько такая задача эффективно может решиться XGBoost или он вообще не конкурент DL
Глупая задача, вам не кажется делать прогноз на 1 день? Что бы такое вычислить необходимо уситывать мнодество факторов имея статистические данные за предыдущие аналогичные периоды. Можно предположить поведение покупателя, используя тнориб игр и теорию вероятностей.
источник

AK

Alex K in Python для анализа данных
Игорь Кудрешов
Глупая задача, вам не кажется делать прогноз на 1 день? Что бы такое вычислить необходимо уситывать мнодество факторов имея статистические данные за предыдущие аналогичные периоды. Можно предположить поведение покупателя, используя тнориб игр и теорию вероятностей.
Выбирать задачи не могу. Она есть как данность. Но например надо было бы предсказать на 7 дней. Вопрос все равно остаётся вопросом. Может поподробнее можете сказать что смотреть в этих теориях
источник

PZ

Pavel Zheltouhov in Python для анализа данных
Alex K
Выбирать задачи не могу. Она есть как данность. Но например надо было бы предсказать на 7 дней. Вопрос все равно остаётся вопросом. Может поподробнее можете сказать что смотреть в этих теориях
А надо. Новая  Мудрость DL заключается в том чтобы читать SOTA и анализировать бизнес куда тут можно знания применить.
Все наоборот! Не бизнес определяет что вы может сделать наука. Как раньше - невыгодно. Это не json перекладывать из пустого в порожнее, а научный процесс поиска без гарантий.
Так и передайте.
источник

PZ

Pavel Zheltouhov in Python для анализа данных
Ну можно конечно вбухать кучу времени в выведение зависимости пива и угля от погоды...но чет не работает, как мы видим.
источник

PZ

Pavel Zheltouhov in Python для анализа данных
Alex K
Народ, вот есть такой объём ежемесячных продаж по товару.

Я уже писал здесь, но вопрос другой чем был. Повторю условия, чтоб напомнить. Бизнес хочет спрогнозировать ежедневные продажи с минимальной ошибкой.

Сейчас они используют что-то типа скользящего среднего. И ошибка около 15%. Они написали нейронку. Там например погода забита и тд, она показала себя не очень.  

Я нейронки вообще в глаза не видел, с классическим немного имел дело. У меня два варианта, либо отказаться совсем, либо попробовать XGBoost или что-то типа.

Внимание вопрос, правда ли что нейронка имеет лучшее применение на больших выборках, или это бред? И вообще насколько такая задача эффективно может решиться XGBoost или он вообще не конкурент DL
Вот здесь апрель 2020 "короновирусный" скорее всего. Сильная просадка.
Вот чему может наивная сезонная модель научиться? Что опять в апреле будет карантин? Это бред
источник

AK

Alex K in Python для анализа данных
Вопрос как решить задачу максимально хорошо, а не как от неё отказаться. Явно же до какой-то точности мы можем предсказать
источник

PZ

Pavel Zheltouhov in Python для анализа данных
Алгоритм "дед который повторяет все что было вчера"
источник

PZ

Pavel Zheltouhov in Python для анализа данных
Алгоритм "ларек" тоже очень классный:
Ларечник каждый день смотрит в ящички и дозаказывает то, что заканчивается.

И ведь не такой уж плохой
источник

3

3ldar in Python для анализа данных
Alex K
Народ, вот есть такой объём ежемесячных продаж по товару.

Я уже писал здесь, но вопрос другой чем был. Повторю условия, чтоб напомнить. Бизнес хочет спрогнозировать ежедневные продажи с минимальной ошибкой.

Сейчас они используют что-то типа скользящего среднего. И ошибка около 15%. Они написали нейронку. Там например погода забита и тд, она показала себя не очень.  

Я нейронки вообще в глаза не видел, с классическим немного имел дело. У меня два варианта, либо отказаться совсем, либо попробовать XGBoost или что-то типа.

Внимание вопрос, правда ли что нейронка имеет лучшее применение на больших выборках, или это бред? И вообще насколько такая задача эффективно может решиться XGBoost или он вообще не конкурент DL
Правильно понимаю, что пока не использовали даже что-то простое, типа линейной регрессии?
источник