Size: a a a

Python для анализа данных

2020 December 07

P

Pavel in Python для анализа данных
Всем привет!
Подскажите, как для каждого значения в одной колонке найти минимальное значение даты по другой?

Например на входе:
Uid Date
1     2020-05-01
2     2020-08-07
2     2020-07-10
1     2020-02-08

На выходе:
Uid Date
1     2020-02-08
2     2020-07-10
источник

АМ

Алексей Макаров... in Python для анализа данных
Pavel
Всем привет!
Подскажите, как для каждого значения в одной колонке найти минимальное значение даты по другой?

Например на входе:
Uid Date
1     2020-05-01
2     2020-08-07
2     2020-07-10
1     2020-02-08

На выходе:
Uid Date
1     2020-02-08
2     2020-07-10
df.groupby([‘Uid’])[‘Date’].min()
источник

P

Pavel in Python для анализа данных
Алексей Макаров
df.groupby([‘Uid’])[‘Date’].min()
оу)) точно, спасибо))
источник

P

Pavel in Python для анализа данных
А если например нужно сохранить еще 5 полей, то есть взять ту строку со всеми полями, у которой дата минимальная?
источник

3

3ldar in Python для анализа данных
Pavel
А если например нужно сохранить еще 5 полей, то есть взять ту строку со всеми полями, у которой дата минимальная?
df.loc[[df[‘Date’].idxmin()]]
источник

АМ

Алексей Макаров... in Python для анализа данных
Pavel
А если например нужно сохранить еще 5 полей, то есть взять ту строку со всеми полями, у которой дата минимальная?
Я бы сделал как-то так df.loc[df.groupby([‘Uid’])[‘Date’].idxmin().values]
источник

АМ

Алексей Макаров... in Python для анализа данных
Но важно учесть, что idxmin() возвращает индекс первой строки, которая соответствует минимальному значению. Так что если в датафрейме для группы будет 2 строки, где дата минимальная, то для группы возвратится только первая строка
источник

P

Pavel in Python для анализа данных
Спасибо, протестирую завтра
источник
2020 December 08

A

Andrey Denisov in Python для анализа данных
Привет, никто не занимается предиктивом? Есть желание попробовать предсказать закупку товаров на достаточно больших данных. Есть остатки на дату, продажи за период.

С чего стоит начать? Чем можно ещё обогащать?
источник

R

Ruslan in Python для анализа данных
Andrey Denisov
Привет, никто не занимается предиктивом? Есть желание попробовать предсказать закупку товаров на достаточно больших данных. Есть остатки на дату, продажи за период.

С чего стоит начать? Чем можно ещё обогащать?
Мне кажется такую величину предсказать не получится
источник

KM

Konstantin Mohov in Python для анализа данных
да ну
источник

KM

Konstantin Mohov in Python для анализа данных
предсказать можно все, были бы данные
источник

R

Ruslan in Python для анализа данных
Вернее нет смысла в том чтобы ее предсказывать через стат методы
источник

R

Ruslan in Python для анализа данных
Konstantin Mohov
предсказать можно все, были бы данные
Смотря с какой точностью)
источник

R

Ruslan in Python для анализа данных
Закупка рассчитываемая и управляемая величина, т.е. исключает из себя элемент случайности. Поэтому закупку можно предсказать простым среднем по дням предыдущих недель. Примерно посмотреть заказы на склады по пн, вт,  ср и т.д. Взять среднее по этим дням по неделям и вуаля. Будет точность 90-95%
источник

A

Andrey Denisov in Python для анализа данных
Ну задачи какого-то 100%-ного предиктива не стоит - хочется покрутить-повертеть, вдруг, на что и сгодится.
Данные есть и их много - та же сезонность ярко выражена, например
источник

KM

Konstantin Mohov in Python для анализа данных
если данные нормальные и чистые, то и точность будет высокая. Конечно, я не говорю о данных до и во время пандемии (например).
источник

KM

Konstantin Mohov in Python для анализа данных
Ruslan
Закупка рассчитываемая и управляемая величина, т.е. исключает из себя элемент случайности. Поэтому закупку можно предсказать простым среднем по дням предыдущих недель. Примерно посмотреть заказы на склады по пн, вт,  ср и т.д. Взять среднее по этим дням по неделям и вуаля. Будет точность 90-95%
мы тоже думаем, что наше поведение в интернете -управляемая величина, однако, гугл все знает наперед))
источник

A

Andrey Denisov in Python для анализа данных
Ruslan
Закупка рассчитываемая и управляемая величина, т.е. исключает из себя элемент случайности. Поэтому закупку можно предсказать простым среднем по дням предыдущих недель. Примерно посмотреть заказы на склады по пн, вт,  ср и т.д. Взять среднее по этим дням по неделям и вуаля. Будет точность 90-95%
Не, речь про закупку больше в разрезе как функции от продаж. Ессно, она управляемая величина)
источник

A

Andrey Denisov in Python для анализа данных
Собственно, вопрос был - с чего начать? Есть какая-то либа или направление куда копать?
Слышал что-то про fb-шную либу
источник