Size: a a a

Python для анализа данных

2021 February 06

PZ

Pavel Zheltouhov in Python для анализа данных
Или кризис 2008  - он вообще следствие излишнего доверия моделям. Переоценка надежности
источник

AK

Alex K in Python для анализа данных
Pavel Zheltouhov
Или кризис 2008  - он вообще следствие излишнего доверия моделям. Переоценка надежности
восстание декабристов!
источник

СИ

Сергей Ильин... in Python для анализа данных
Alex K
второе это типа plot по категориям товаров?
Не. Второе - это именно сущностно понять, чем этот месяц отличается.
У меня случай был, когда один из месяцев был строго не похож на другие. Оказалось, что именно в этом месяце условный Петрович уходил в отпуск, а подходы Иваныча были немного другими. Искали проблему долго.
источник

СИ

Сергей Ильин... in Python для анализа данных
Alex K
второе это типа plot по категориям товаров?
Это тоже хорошая идея - поглядеть, все ли товары повели себя одинаково?
источник

СИ

Сергей Ильин... in Python для анализа данных
Сергей Ильин
Это тоже хорошая идея - поглядеть, все ли товары повели себя одинаково?
Т.е. всякие корреляции построить и все вот это
источник

AK

Alex K in Python для анализа данных
Сергей Ильин
Не. Второе - это именно сущностно понять, чем этот месяц отличается.
У меня случай был, когда один из месяцев был строго не похож на другие. Оказалось, что именно в этом месяце условный Петрович уходил в отпуск, а подходы Иваныча были немного другими. Искали проблему долго.
а, ну тут январь был, вторая половина. хотя по общей сумме продаж по неделям она близка к медиане
источник

PZ

Pavel Zheltouhov in Python для анализа данных
Сергей Ильин
Не. Второе - это именно сущностно понять, чем этот месяц отличается.
У меня случай был, когда один из месяцев был строго не похож на другие. Оказалось, что именно в этом месяце условный Петрович уходил в отпуск, а подходы Иваныча были немного другими. Искали проблему долго.
Слишком сложно.  судя по изначальной постановке вопроса ожидался какой-то волшебный метод в пандас
источник

AK

Alex K in Python для анализа данных
Сергей Ильин
Это тоже хорошая идея - поглядеть, все ли товары повели себя одинаково?
я придумал посмотреть пока на самые отклонивиеся товары
источник

AK

Alex K in Python для анализа данных
Pavel Zheltouhov
Слишком сложно.  судя по изначальной постановке вопроса ожидался какой-то волшебный метод в пандас
не верный вывод
источник

СИ

Сергей Ильин... in Python для анализа данных
Alex K
а, ну тут январь был, вторая половина. хотя по общей сумме продаж по неделям она близка к медиане
Хм. Смотрите понедельно ещё. Январь - он такой.
источник

СИ

Сергей Ильин... in Python для анализа данных
Alex K
я придумал посмотреть пока на самые отклонивиеся товары
Отличное решение.
источник

СИ

Сергей Ильин... in Python для анализа данных
Alex K
не верный вывод
+
источник

СИ

Сергей Ильин... in Python для анализа данных
Pavel Zheltouhov
Слишком сложно.  судя по изначальной постановке вопроса ожидался какой-то волшебный метод в пандас
Скорее, человек искал путь, по которому можно было бы пройти в поисках проблемы и подтверждения / определения выбросов
источник

AK

Alex K in Python для анализа данных
Сергей Ильин
Скорее, человек искал путь, по которому можно было бы пройти в поисках проблемы и подтверждения / определения выбросов
+
источник

PZ

Pavel Zheltouhov in Python для анализа данных
Подумал о методе претендующем на универсальность :
из текущей нейронки взять feature importance, дообучить новым месяцем, взять еще раз и посмотреть отличия
источник

СИ

Сергей Ильин... in Python для анализа данных
Pavel Zheltouhov
Подумал о методе претендующем на универсальность :
из текущей нейронки взять feature importance, дообучить новым месяцем, взять еще раз и посмотреть отличия
Отличия вы хотите посмотреть в выбранных фичах?
источник

PZ

Pavel Zheltouhov in Python для анализа данных
Сергей Ильин
Отличия вы хотите посмотреть в выбранных фичах?
Да.Как в shap. Будет две картинки и дальше глазами
источник

PZ

Pavel Zheltouhov in Python для анализа данных
То есть, это ближе к вопросу почему эта нейронка ошибается, нежели к вопросу в чем ключевые отличия
источник

СИ

Сергей Ильин... in Python для анализа данных
Можно пойти немного дальше:
(Все равно этот месяц не изменить)

Взять модель, взять предикты по этому месяцу, добавить факты по этому месяцу и пересчитать модель так, чтобы она обнаружила эти различия
источник

СИ

Сергей Ильин... in Python для анализа данных
Pavel Zheltouhov
То есть, это ближе к вопросу почему эта нейронка ошибается, нежели к вопросу в чем ключевые отличия
Да, обычно это - самое тяжелое.
источник