Size: a a a

Python для анализа данных

2021 January 19

BB

Bogdan Burich in Python для анализа данных
Правда, библиотеки могут работать не все
У меня для визуализации seaborn не работал в Power BI, для обработки данных - не знаю, но пандас он точно понимает
источник

А

Алексей in Python для анализа данных
кто нибудь юзал ClickHouse в Облаке Яндекса? Не могу понять как дать права пользователю на создание таблиц, всю документацию перерыл уже
источник

h

helby in Python для анализа данных
Bogdan Burich
Правда, библиотеки могут работать не все
У меня для визуализации seaborn не работал в Power BI, для обработки данных - не знаю, но пандас он точно понимает
Да это я знаю все))

Хотел узнать, возможно ли решение конкретно моей задачи?)

Это же с помощью цикла нужно решать, правильно?
источник

s

ssv in Python для анализа данных
Алексей
кто нибудь юзал ClickHouse в Облаке Яндекса? Не могу понять как дать права пользователю на создание таблиц, всю документацию перерыл уже
источник

А

Алексей in Python для анализа данных
нет, именно ClickHouse в облаке Яндекса
источник

s

ssv in Python для анализа данных
Тогда не подскажу.. В облаке с ним не работал, а стационарно это делается либо через xml-конфиг, либо через посредством SQL (но эта опция должна быть включена).
источник
2021 January 20

BD

Baza Dark.net in Python для анализа данных
🗃Продам базы данных
🏦Хоум кредит 15000 контактов. 20 года. Цена 5000р.
🏦Фора банк мск. 20год.7500 контактов 3500р
💊Купившие БАДы вся РФ 92000 контактов. 20год. Цена 18000р.
🤝Продаю в одни руки.
📁Пробники не даю, базу продаю целиком🗃
Подробности в ЛС @BazaDDark
источник

LT

Lan Tal in Python для анализа данных
Ору
источник

f

f in Python для анализа данных
Baza Dark.net
🗃Продам базы данных
🏦Хоум кредит 15000 контактов. 20 года. Цена 5000р.
🏦Фора банк мск. 20год.7500 контактов 3500р
💊Купившие БАДы вся РФ 92000 контактов. 20год. Цена 18000р.
🤝Продаю в одни руки.
📁Пробники не даю, базу продаю целиком🗃
Подробности в ЛС @BazaDDark
А есть база купивших базы?
источник

AT

Albina Turkevich in Python для анализа данных
f
А есть база купивших базы?
а база сотрудников , прдоающих базы?
источник

ТА

Тимур Алиев... in Python для анализа данных
f
А есть база купивших базы?
в одни руки вроде написано продает 😂
источник

LT

Lan Tal in Python для анализа данных
Видимо продал
источник
2021 January 21

СИ

Сергей Ильин... in Python для анализа данных
Гайз!

С пандасом и мультииндексом поможете?

У меня есть df, сгруппированный с использованием мультииндекса (применен метод .groupby по двум столбцам).
Выполняю:

df_by_month_group.index.levels

Получаю:

FrozenList([[9, 10, 11], ['one', 'two', 'three']])

Все ок.

таким образом я могу получить доступ к первой части этого списка:

df_by_month_group.index.levels[0]

Получаю:

Int64Index([9, 10, 11], dtype='int64', name='month')

Если выполняю цикл
for i in df_by_month_group.index.levels[0]:
   print(i)

ожидаемо получаю
9
10
11


А вот iloc для этого датафрейма не работает:

df_by_month_group.iloc[df_by_month_group.index.levels[0]==9]

IndexError: Boolean index has wrong length: 3 instead of 159

Как поправить?
Мне нужно обрезать мой исходный датафрейм таким образом, чтобы остались только значения, у которых в Мультииндексе первым элементом стоит 9.

Спасибо.
источник

СИ

Сергей Ильин... in Python для анализа данных
Сергей Ильин
Гайз!

С пандасом и мультииндексом поможете?

У меня есть df, сгруппированный с использованием мультииндекса (применен метод .groupby по двум столбцам).
Выполняю:

df_by_month_group.index.levels

Получаю:

FrozenList([[9, 10, 11], ['one', 'two', 'three']])

Все ок.

таким образом я могу получить доступ к первой части этого списка:

df_by_month_group.index.levels[0]

Получаю:

Int64Index([9, 10, 11], dtype='int64', name='month')

Если выполняю цикл
for i in df_by_month_group.index.levels[0]:
   print(i)

ожидаемо получаю
9
10
11


А вот iloc для этого датафрейма не работает:

df_by_month_group.iloc[df_by_month_group.index.levels[0]==9]

IndexError: Boolean index has wrong length: 3 instead of 159

Как поправить?
Мне нужно обрезать мой исходный датафрейм таким образом, чтобы остались только значения, у которых в Мультииндексе первым элементом стоит 9.

Спасибо.
Для воспроизводимости результата


first = [9,9,9,10,10,10]
second = ['one', 'two', 'three', 'one', 'two', 'three']
third = [10, 20, 30, 20, 40, 50]
test = pd.DataFrame(zip(first, second, third), columns=['mon', 'name', 'val'])
test_gr = test.groupby(['mon', 'name']).sum()
test_gr
источник

МS

Мariia Smirnova in Python для анализа данных
Сергей Ильин
Гайз!

С пандасом и мультииндексом поможете?

У меня есть df, сгруппированный с использованием мультииндекса (применен метод .groupby по двум столбцам).
Выполняю:

df_by_month_group.index.levels

Получаю:

FrozenList([[9, 10, 11], ['one', 'two', 'three']])

Все ок.

таким образом я могу получить доступ к первой части этого списка:

df_by_month_group.index.levels[0]

Получаю:

Int64Index([9, 10, 11], dtype='int64', name='month')

Если выполняю цикл
for i in df_by_month_group.index.levels[0]:
   print(i)

ожидаемо получаю
9
10
11


А вот iloc для этого датафрейма не работает:

df_by_month_group.iloc[df_by_month_group.index.levels[0]==9]

IndexError: Boolean index has wrong length: 3 instead of 159

Как поправить?
Мне нужно обрезать мой исходный датафрейм таким образом, чтобы остались только значения, у которых в Мультииндексе первым элементом стоит 9.

Спасибо.
а почему ты используешь iloc,  а не loc?
источник

AK

Alex K in Python для анализа данных
Мariia Smirnova
а почему ты используешь iloc,  а не loc?
и вообще надо ли что-то использовать
источник

AK

Alex K in Python для анализа данных
df_by_month_group[df_by_month_group.index.levels[0]==9]
источник

МS

Мariia Smirnova in Python для анализа данных
Мariia Smirnova
а почему ты используешь iloc,  а не loc?
вопрос отпал
источник

МS

Мariia Smirnova in Python для анализа данных
test_gr.iloc[test_gr.index.get_level_values(0) == 9]или test_gr[test_gr.index.get_level_values(0) == 9]
источник

МS

Мariia Smirnova in Python для анализа данных
https://pandas.pydata.org/pandas-docs/stable/user_guide/advanced.html
тут еще классное решение в Advanced indexing with hierarchical index
источник