Size: a a a

Python для анализа данных

2021 March 09

AM

Anton Malyshev in Python для анализа данных
pd.to_datetime()
источник

ИР

Илья Ревин in Python для анализа данных
там строку надо парсить
источник

ИР

Илья Ревин in Python для анализа данных
он тупит на этом моменте
источник

OO

Oleg Omelchenko in Python для анализа данных
Илья Ревин
он тупит на этом моменте
строка как выглядит?
источник

ИР

Илья Ревин in Python для анализа данных
1 мая 2019
источник

VR

Vasily Rozhkov in Python для анализа данных
Илья Ревин
Комрады подскажите как в pandas  перевести строку в дату
если грузите данные в датафрейм через pd.DataFrame, то смотрите параметр  parse_dates
просто столбцы с датами нужно перечислить
источник

VR

Vasily Rozhkov in Python для анализа данных
Илья Ревин
1 мая 2019
сорри, не увидел инфо)
тогда не то написал
источник

ИР

Илья Ревин in Python для анализа данных
вот и я в ступоре)
источник

SZ

Sergei Zotov in Python для анализа данных
это по-любому как-то через что-то такое решается. Надо гуглить to_datetime и форматы

pd.to_datetime(df['dates'], format='%Y%m%d-%H%M%S')
источник

SZ

Sergei Zotov in Python для анализа данных
источник

LK

Lyubov K. in Python для анализа данных
источник

LK

Lyubov K. in Python для анализа данных
источник

LK

Lyubov K. in Python для анализа данных
Привет! Пытаюсь делать кластеризацию. Только учусь.

На кластеры удалось разбить сет

А можно ли такую картинку сделать?
источник

И

Ингварчик in Python для анализа данных
Всем привет, а кто-то тут составлял дерево продуктовых метрик?
источник

3

3ldar in Python для анализа данных
Lyubov K.
Привет! Пытаюсь делать кластеризацию. Только учусь.

На кластеры удалось разбить сет

А можно ли такую картинку сделать?
источник

LK

Lyubov K. in Python для анализа данных
Да, но здесь выбор по двум столбцам. А у меня признаки бинарные, меня это в ступор как-то ставит
источник

PZ

Pavel Zheltouhov in Python для анализа данных
Lyubov K.
Да, но здесь выбор по двум столбцам. А у меня признаки бинарные, меня это в ступор как-то ставит
В смысле  многомерный набор бинарных признаков?
источник

PZ

Pavel Zheltouhov in Python для анализа данных
2d-картинку из многомерных данных, очевидно, никак не нарисовать. Хотя k-means все равно отработал с ними.

Так мы приходим к идее поиска алгоритма снижения размерности.
И это целый отдельный класс алгоритмов.
источник

OO

Oleg Omelchenko in Python для анализа данных
Илья Ревин
1 мая 2019
я бы в два шага сделал, сначала трансформировал названия месяцев в числовые значения типа 1-05-2019 а потом через pd.to_datetime(col, format='%-d-%m-%Y')
источник

ИР

Илья Ревин in Python для анализа данных
Lyubov K.
Привет! Пытаюсь делать кластеризацию. Только учусь.

На кластеры удалось разбить сет

А можно ли такую картинку сделать?
Визуализировать кластеризацию возможно или в 2-d или в 3-d формате. Как правильно было сказано выше твоя задача сводится к отысканию подпространства меньшей размерности в твоем исходном пространстве признаков. После того как ты нашел это подпространство ты проецируешь на него свои вектора с некоторой погрешностью. Таким образом у тебя получается описание твоего объекта через 2 или 3 вектора, который образуют базис подпространства. А  уже потом в этом подпространстве ты можешь кластеризировать свои объекты используя метрические алгоритмы, и благодаря тому что у тебя твое новое подпространство легко интерпретируемо (всего 2-3 признака) ты можешь эти кластеры объяснить с точки зрения бизнес логики.
источник