Size: a a a

Python для анализа данных

2019 September 19

dd

dgj dfsh in Python для анализа данных
отличия в первой и последней строках
источник

YP

Yuriy Prudnikov in Python для анализа данных
dgj dfsh
отличия в первой и последней строках
Можно в  csv?
источник

BB

Bogdan Burich in Python для анализа данных
Можно ли одним методом replace заменить не одно, а несколько значений в строке на нужные?
источник

А

Алексей in Python для анализа данных
Bogdan Burich
Можно ли одним методом replace заменить не одно, а несколько значений в строке на нужные?
text = 'qwqewqewqeggghhhvvvvbvc'
x = {'a':3, 'd':5, 'g':8}

for key in x.keys():
   text = text.replace(key, str(x[key]))

print(text)
источник

BB

Bogdan Burich in Python для анализа данных
Алексей
text = 'qwqewqewqeggghhhvvvvbvc'
x = {'a':3, 'd':5, 'g':8}

for key in x.keys():
   text = text.replace(key, str(x[key]))

print(text)
Я думал может быть можно как-то засунуть в качестве аргументов в метод, но так даже лучше, спасибо!
источник

YP

Yuriy Prudnikov in Python для анализа данных
Bogdan Burich
Я думал может быть можно как-то засунуть в качестве аргументов в метод, но так даже лучше, спасибо!
Можно. Загкгли python multiple replace in string
источник

BB

Bogdan Burich in Python для анализа данных
Спасибо, на русском не нашел
источник
2019 September 20

AP

Andrey Pushvitsev in Python для анализа данных
Так это, регулярки же

import re
re.sub(pattern, repl, string, count=0, flags=0)
источник

dd

dgj dfsh in Python для анализа данных
Yuriy Prudnikov
Можно в  csv?
правильно
idx,f1,f2,f3,f4,b,w,a
0,1,1,1,1,41.0,,14.0
0,1,1,1,2,8.0,30.0,79.0
0,1,1,2,1,58.0,,83.0
0,1,1,2,2,8.0,,47.0
0,1,2,1,1,52.0,,33.0
0,1,2,1,2,96.0,,15.0
0,1,2,2,1,73.0,,58.0
0,1,2,2,2,18.0,,50.0
0,2,1,1,1,20.0,,30.0
0,2,1,1,2,95.0,,94.0
0,2,1,2,1,19.0,,71.0
0,2,1,2,2,7.0,,53.0
0,2,2,1,1,42.0,,77.0
0,2,2,1,2,31.0,,76.0
0,2,2,2,1,2.0,,40.0
0,2,2,2,2,37.0,,86.0
1,1,1,1,1,30.0,,30.0
1,1,1,1,2,,30.0,
2,1,1,1,1,30.0,,30.0


неправильно
idx,f1,f2,f3,f4,b,w,a
1.0,1,1,1,1,30.0,,14.0
1.0,1,1,1,2,8.0,30.0,79.0
1.0,1,1,2,1,58.0,,83.0
1.0,1,1,2,2,8.0,,47.0
1.0,1,2,1,1,52.0,,33.0
1.0,1,2,1,2,96.0,,15.0
1.0,1,2,2,1,73.0,,58.0
1.0,1,2,2,2,18.0,,50.0
1.0,2,1,1,1,20.0,,30.0
1.0,2,1,1,2,95.0,,94.0
1.0,2,1,2,1,19.0,,71.0
1.0,2,1,2,2,7.0,,53.0
1.0,2,2,1,1,42.0,,77.0
1.0,2,2,1,2,31.0,,76.0
1.0,2,2,2,1,2.0,,40.0
1.0,2,2,2,2,37.0,,86.0
2.0,1,1,1,1,30.0,,30.0
2.0,1,1,1,2,,30.0,
3.0,1,1,1,1,41.0,,30.0
источник

MY

Maksim Yasinski in Python для анализа данных
добрый день!
подскажите как можно транспонировать табличку при чтении из экселя? вопрос в том, что столбцы имеют мультииндекс, идет месяц "Январь" и в каждом месяце есть разные виды деятельности предприятия, соответственно, чтобы корректно по этим данным итерировать нужно, чтобы столбцы стали индексом
источник

ВЛ

Владислав Литвинюк... in Python для анализа данных
Maksim Yasinski
добрый день!
подскажите как можно транспонировать табличку при чтении из экселя? вопрос в том, что столбцы имеют мультииндекс, идет месяц "Январь" и в каждом месяце есть разные виды деятельности предприятия, соответственно, чтобы корректно по этим данным итерировать нужно, чтобы столбцы стали индексом
df.index = df['date']
источник

OO

Oleg Omelchenko in Python для анализа данных
Привет!

Хочу решить следующую задачу:
Есть список со объектов типа
[
{'dt': <datetime1>, 'event': 'event1'},
{'dt': <datetime2>, 'event': 'event2'},
{'dt': <datetime3>, 'event': 'event2'},
{'dt': <datetime4>, 'event': 'event3'}
]

Хочу написать функцию, чтобы с этим списком на входе получить на выходе такое:
['event1', 'event2 (x2)', 'event3']

Отсортировать по datetime и сгруппировать повторяющиеся события с указанием количества повторений.

С сортировкой все понятно, а вторая вызывает затруднение. на чистом питоне или Пандами — не так важно
источник

MY

Maksim Yasinski in Python для анализа данных
так сначала прочитать надо, оно прочитает месяца и потом всякая ерунда подтянется
источник

ВЛ

Владислав Литвинюк... in Python для анализа данных
Maksim Yasinski
так сначала прочитать надо, оно прочитает месяца и потом всякая ерунда подтянется
покажите df
источник

MY

Maksim Yasinski in Python для анализа данных
pandas ведь дает мульти только в индексе делать, не в столбцах
источник

MY

Maksim Yasinski in Python для анализа данных
источник

MY

Maksim Yasinski in Python для анализа данных
и так по каждому месяцу
источник

dd

dgj dfsh in Python для анализа данных
@goto95 задача решена с помощью cumcount
df['idx'] = df.groupby(['f1', ...]).cumcount()
получается так же как и с моим подходом с apply
источник

YP

Yuriy Prudnikov in Python для анализа данных
dgj dfsh
@goto95 задача решена с помощью cumcount
df['idx'] = df.groupby(['f1', ...]).cumcount()
получается так же как и с моим подходом с apply
Интересно, не пользовался раньше этим, спасибо
источник

e

eolay in Python для анализа данных
Немного визуализации:
Про создание в matplotlib "гоночного" графика (затрудняюсь перевести точнее 😂) от Pratap Vardhan
https://colab.research.google.com/github/pratapvardhan/notebooks/blob/master/barchart-race-matplotlib.ipynb#scrollTo=rMPQi-JT2Eny
источник