Size: a a a

Python для анализа данных

2020 November 23

MD

Mikhail Damaskin in Python для анализа данных
да
источник

AS

Alex Savva in Python для анализа данных
права 0700 на папку .sftp и 0600 на файл authorized_keys установлены?
источник

AS

Alex Savva in Python для анализа данных
И каким клиентом пользуетесь?
источник

MD

Mikhail Damaskin in Python для анализа данных
Alex Savva
права 0700 на папку .sftp и 0600 на файл authorized_keys установлены?
про права не знаю, но уже получилось стандартными средствами filezilla подключиться - не было возможности раньше поставить, пытался через консоль
источник

AS

Alex Savva in Python для анализа данных
Ну, если подключились, значит с правами всё ок))
источник
2020 November 24

IB

Ivan Bartenyov in Python для анализа данных
Коллеги подскажите как сделать следующую операцию. Есть 2 дата фрема в одном время посещения и номер пользователя, в другом дата создания заказа и номер пользователя создавшего заказ. Как мне их объединить в один дф, чтобы заказы были объединены по номеру пользователя и отсортированы по времени и не было дублей. Т.е. к примеру есть пользователь 133 у него 2 посещения 01.10.2020 и 1 посещение 03.11.2020 и заказы созданы 02.10.2020 и 05.11.2020. Как получить табицу чтобы строчки шли 2 посещения 01.10.2020, затем 1 заказ 02.10.2020 затем снова посещение 03.11.2020 и заказ 05.11.2020.

merge по номеру пользователя пробовал, но он дает дубли и в них проблема. Если объединить чисто по датам, то данные о заказах вообще теряются
источник

КД

Кирилл Дмитриевич... in Python для анализа данных
Можно пример в экселе?
источник

КД

Кирилл Дмитриевич... in Python для анализа данных
Как есть и как должно получиться
источник

KM

Konstantin Mohov in Python для анализа данных
pd.merge(how=left, on=user_id) дальше 2 колонки дат сводите в 1, после сортировка ['user_id', 'new_date']
источник

IB

Ivan Bartenyov in Python для анализа данных
Спасибо, а можно чуть подробнее, что значит 2 колонки дат сводите в одну ?. Вместо пропусков во времени посещения,  вставить время заказа ?
источник

R

Ruslan in Python для анализа данных
Ivan Bartenyov
Коллеги подскажите как сделать следующую операцию. Есть 2 дата фрема в одном время посещения и номер пользователя, в другом дата создания заказа и номер пользователя создавшего заказ. Как мне их объединить в один дф, чтобы заказы были объединены по номеру пользователя и отсортированы по времени и не было дублей. Т.е. к примеру есть пользователь 133 у него 2 посещения 01.10.2020 и 1 посещение 03.11.2020 и заказы созданы 02.10.2020 и 05.11.2020. Как получить табицу чтобы строчки шли 2 посещения 01.10.2020, затем 1 заказ 02.10.2020 затем снова посещение 03.11.2020 и заказ 05.11.2020.

merge по номеру пользователя пробовал, но он дает дубли и в них проблема. Если объединить чисто по датам, то данные о заказах вообще теряются
А не вариант сначала отсортировать датафреймы по дате заказа и по дате посещения. А потом сделать left merge
источник

R

Ruslan in Python для анализа данных
?
источник

IB

Ivan Bartenyov in Python для анализа данных
А как избавиться от дублей в заказах ?
источник

R

Ruslan in Python для анализа данных
Ну потом drop duplicates по сцепке пользователь дата заказа и дата посещения
источник

R

Ruslan in Python для анализа данных
источник

R

Ruslan in Python для анализа данных
У тебя должно вроде так получится
источник

R

Ruslan in Python для анализа данных
До улаления дублей
источник

IB

Ivan Bartenyov in Python для анализа данных
Спасибо, попробую
источник

R

Ruslan in Python для анализа данных
Я проверил не получится. Сцепка будет уникальной
источник

R

Ruslan in Python для анализа данных
Можно зайти через merge потом group by и после apply с lambda
источник