Size: a a a

Python для анализа данных

2021 February 07

AK

Alex K in Python для анализа данных
3ldar
Правильно понимаю, что пока не использовали даже что-то простое, типа линейной регрессии?
Они сейчас предсказывают по скользящему среднему+ влияние типа двух последних понедельников(если прогноз на понедельник). Наверное это и есть линейная регрессия
источник

3

3ldar in Python для анализа данных
Alex K
Они сейчас предсказывают по скользящему среднему+ влияние типа двух последних понедельников(если прогноз на понедельник). Наверное это и есть линейная регрессия
Ну такое
источник

PZ

Pavel Zheltouhov in Python для анализа данных
"Сейчас они используют что-то типа скользящего среднего. И ошибка около 15%. " - оо , это алгоритм дед в ларьке. Прорыв
источник

PZ

Pavel Zheltouhov in Python для анализа данных
Синтез
источник

AK

Alex K in Python для анализа данных
Павел. Давай конструктивно.
источник

3

3ldar in Python для анализа данных
А что за бизнес? Наверняка, можно принять во внимание какие-то открытые данные опережающего характера🤔
источник

PZ

Pavel Zheltouhov in Python для анализа данных
Делай что можешь.
Если бы эта задача решалась, мы бы всю биржу скупили бы давно и тут не парились
источник

AK

Alex K in Python для анализа данных
3ldar
А что за бизнес? Наверняка, можно принять во внимание какие-то открытые данные опережающего характера🤔
Розничная торговля продукты
источник

AK

Alex K in Python для анализа данных
Что-то тип вкусвилл
источник

AK

Alex K in Python для анализа данных
3ldar
Ну такое
Xgboost условный тут не примененим?
источник

3

3ldar in Python для анализа данных
Alex K
Xgboost условный тут не примененим?
Почему же, применим)
Можно в нём линейку заюзать
источник

3

3ldar in Python для анализа данных
Но судя по тому, что я прочитал, вам не хватает фичей. Подумайте, мб, о том, какие фичи можно нагенерить для модели
источник

D

Daria in Python для анализа данных
Сергей Ильин
скажите, а в Plotly кто-нибудь с анимацией / слайдерами мучился? пару бы вопросов задать..
я мучилась) в чем ваш вопрос?
источник

D

Dima🐼 in Python для анализа данных
Alex K
Народ, вот есть такой объём ежемесячных продаж по товару.

Я уже писал здесь, но вопрос другой чем был. Повторю условия, чтоб напомнить. Бизнес хочет спрогнозировать ежедневные продажи с минимальной ошибкой.

Сейчас они используют что-то типа скользящего среднего. И ошибка около 15%. Они написали нейронку. Там например погода забита и тд, она показала себя не очень.  

Я нейронки вообще в глаза не видел, с классическим немного имел дело. У меня два варианта, либо отказаться совсем, либо попробовать XGBoost или что-то типа.

Внимание вопрос, правда ли что нейронка имеет лучшее применение на больших выборках, или это бред? И вообще насколько такая задача эффективно может решиться XGBoost или он вообще не конкурент DL
почему именно XGBoost ? Я бы посмотрел в сторону какого-нибудь fbprophet
источник

AK

Alex K in Python для анализа данных
3ldar
Но судя по тому, что я прочитал, вам не хватает фичей. Подумайте, мб, о том, какие фичи можно нагенерить для модели
Спасибо
источник

СИ

Сергей Ильин... in Python для анализа данных
Daria
я мучилась) в чем ваш вопрос?
чтобы не засорять, могу лично написать?
источник

AK

Alex K in Python для анализа данных
3ldar
Но судя по тому, что я прочитал, вам не хватает фичей. Подумайте, мб, о том, какие фичи можно нагенерить для модели
Пока придумал что надо понять могу ли я предсказать продажи по вообще всем товарам. Или хотя бы по крупной группе. И там уже смотреть
источник

ЕО

Егор Овчинников... in Python для анализа данных
Всем привет! Пытаюсь вывести строки датафрейма по условию пропусков в определённом столбце.
df[df['feat'].isna().sum() > 0]
Выводит True.
Подскажите пожалуйста, как мне это сделать?
источник

IS

Ivan Samorukov in Python для анализа данных
Егор Овчинников
Всем привет! Пытаюсь вывести строки датафрейма по условию пропусков в определённом столбце.
df[df['feat'].isna().sum() > 0]
Выводит True.
Подскажите пожалуйста, как мне это сделать?
df[df['feat'].isna()]
источник

ET

Evgeniy Troshichev in Python для анализа данных
Скользящее среднее будет трудно переплюнуть в данном случае, а вот попробовать улучшить предсказывая его ошибку можно попробовать.
источник