Size: a a a

Python для анализа данных

2021 February 13

AK

Alex K in Python для анализа данных
3ldar
Согласен, что ничего не понятно из описания 🙁
Давайте, может, визуализацию того, что хочется получить
вот смотрите, тут я делал цикл когда у меня был один заказ и только даты в индексе. Чейчас у меня ещё один слой индексов появился, и теперь мне надо для каждого заказа и для каждой даты  посчиать отдельно
источник

AK

Alex K in Python для анализа данных
хрен знает станет ли яснее конечно, но вдруг
источник

AK

Alex K in Python для анализа данных
но весь смысл в верхнем for
источник

AK

Alex K in Python для анализа данных
вот мне так же надо проиттерироваться по всем уроввням индекса. Почему-то кажется что apply более адекватен
источник

AK

Alex K in Python для анализа данных
да, наверн такую портянку неуместно тут выкладывать было
источник

ЕО

Егор Овчинников... in Python для анализа данных
Что вы обычно делаете, когда у вас пропущенные значения в таком количестве?
источник

PZ

Pavel Zheltouhov in Python для анализа данных
Егор Овчинников
Что вы обычно делаете, когда у вас пропущенные значения в таком количестве?
вы по сути наукой занимаетесь, а вопросы ремесленные задаете.
Что-то делают. Заполняют. Или не заполняют.
источник

ЕО

Егор Овчинников... in Python для анализа данных
Если посоветовать нечего, лучше ничего не пишите.
источник

PZ

Pavel Zheltouhov in Python для анализа данных
По-моему, это максимально продуктивный совет в перспективе
источник

ЕО

Егор Овчинников... in Python для анализа данных
По-вашему...
источник

KM

Konstantin Mohov in Python для анализа данных
Pavel Zheltouhov
вы по сути наукой занимаетесь, а вопросы ремесленные задаете.
Что-то делают. Заполняют. Или не заполняют.
плюсую к ответу. зполняют или не заполняют. нулем или средним. или медианой. или средним по категории. или удаляют. все только от контекста зависит
источник

ЕО

Егор Овчинников... in Python для анализа данных
Блин)))))))))Да это понятно. Я интересовался скорее размерами количества пропусков. Что практикуют люди, когда у них около 50% и более данных пропущено?! А не чем заполнять) Возможно что-то замечали по порогам удаления признаков или еще что-то.
источник

ЕО

Егор Овчинников... in Python для анализа данных
Konstantin Mohov
плюсую к ответу. зполняют или не заполняют. нулем или средним. или медианой. или средним по категории. или удаляют. все только от контекста зависит
А так бы и я плюсанул)
источник

PZ

Pavel Zheltouhov in Python для анализа данных
Научная постановка вопроса выглядела бы так:
Гипотеза : заполнение медианным вызовет улучшение точности ?
Эксперимент : делаете все это.
Вывод .
источник

KM

Konstantin Mohov in Python для анализа данных
Егор Овчинников
Блин)))))))))Да это понятно. Я интересовался скорее размерами количества пропусков. Что практикуют люди, когда у них около 50% и более данных пропущено?! А не чем заполнять) Возможно что-то замечали по порогам удаления признаков или еще что-то.
Если больше 50% пропусков берёте биту и идёте к тому, кто выгружал данные ))))
источник

KM

Konstantin Mohov in Python для анализа данных
Ибо это уже аномалия
источник

ЕО

Егор Овчинников... in Python для анализа данных
Konstantin Mohov
Если больше 50% пропусков берёте биту и идёте к тому, кто выгружал данные ))))
Вооот так и предполагал.......
источник

PZ

Pavel Zheltouhov in Python для анализа данных
Но тут похоже на многомерный набор объявлений недвижимости каких-то. Люди просто не заполняют эти поля и не считают нужным.
источник

ЕО

Егор Овчинников... in Python для анализа данных
"Банковский" набор
источник

PZ

Pavel Zheltouhov in Python для анализа данных
Как ремесленник ремесленнику, посоветую xgboost.
источник