Size: a a a

Python для анализа данных

2021 February 06

PZ

Pavel Zheltouhov in Python для анализа данных
Alex K
Подумал что моя задача наверное супер тривиальная должна быть. Тип предсказали. Прогнозы не верные оказались и надо проверить кто виноват
Так надо начать с вопроса : дообученная на всех месяцах модель предсказывает и последний месяц удовлетворительно?
источник

AK

Alex K in Python для анализа данных
Pavel Zheltouhov
Так надо начать с вопроса : дообученная на всех месяцах модель предсказывает и последний месяц удовлетворительно?
ну вот фиговые результаты получилиь во второй половине янваоя
источник

PZ

Pavel Zheltouhov in Python для анализа данных
Alex K
ну вот фиговые результаты получилиь во второй половине янваоя
Так обучали январем или нет?
источник

DK

Dmitriy Kostarev in Python для анализа данных
Здравствуйте подскажите. Есть столбец с True, False. Есть столбец с user. У некоторых user могут быть только False, у некоторых и True и False. Как мне разделить их.
источник

СИ

Сергей Ильин... in Python для анализа данных
Dmitriy Kostarev
Здравствуйте подскажите. Есть столбец с True, False. Есть столбец с user. У некоторых user могут быть только False, у некоторых и True и False. Как мне разделить их.
Разделить на что?

df_true = df[df[‘столбец с тру/фолс ’]==‘True’]

Так?
источник

DK

Dmitriy Kostarev in Python для анализа данных
Сергей Ильин
Разделить на что?

df_true = df[df[‘столбец с тру/фолс ’]==‘True’]

Так?
Мне нужно user у кого есть true/false отделить от user у кого только false
источник

СИ

Сергей Ильин... in Python для анализа данных
Alex K
ну вот фиговые результаты получилиь во второй половине янваоя
Короч, реально попробуйте: долбучить на январе и попробовать предсказать январь.

Ну и да, надо временные ряды смотреть: все эти сезонные компоненты, тренд, остаток...
источник

СИ

Сергей Ильин... in Python для анализа данных
Dmitriy Kostarev
Мне нужно user у кого есть true/false отделить от user у кого только false
Покажите df.head(), чтобы понять, как они уложены у вас
источник

AK

Alex K in Python для анализа данных
да, я понял, посмотрю
источник

СИ

Сергей Ильин... in Python для анализа данных
Dmitriy Kostarev
Мне нужно user у кого есть true/false отделить от user у кого только false
Под «отделить» вы что имеете ввиду? В отдельный df? Или как? Или в отдельный столбец 1 или 0 записать? Вариантов много
источник

DK

Dmitriy Kostarev in Python для анализа данных
Сергей Ильин
Под «отделить» вы что имеете ввиду? В отдельный df? Или как? Или в отдельный столбец 1 или 0 записать? Вариантов много
Можно бинарным признаком отметить, можно в отдельный df. Мне надо понять как можно их различать
источник

СИ

Сергей Ильин... in Python для анализа данных
Dmitriy Kostarev
Можно бинарным признаком отметить, можно в отдельный df. Мне надо понять как можно их различать
Если бинарным, то

df[‘binary’] = df...
источник

СИ

Сергей Ильин... in Python для анализа данных
Сергей Ильин
Покажите df.head(), чтобы понять, как они уложены у вас
Повторюсь.
источник

DK

Dmitriy Kostarev in Python для анализа данных
Сделал через group by и nunique
источник

СИ

Сергей Ильин... in Python для анализа данных
Dmitriy Kostarev
Сделал через group by и nunique
Да, тоже вариант, наверное.
Мы данных не видели. Если устроило - вообще отлично
источник

A

Aleksandr in Python для анализа данных
Всем привет! А сколько вообще должна длиться лемматизация столбца с 21к значений?
источник

IS

Ivan Samorukov in Python для анализа данных
Смотря чем пользуешься. Эффективнее запихнуть все строки в одну и с ней работать
источник

IS

Ivan Samorukov in Python для анализа данных
Библиотекой яндекса пользуешься?
источник

A

Aleksandr in Python для анализа данных
Да, около 10 минут жду и пока ничего
источник

IS

Ivan Samorukov in Python для анализа данных
У неё инициализация долгая. Если каждую строку отдельно запускать, то кучу времени займёт
источник