Телеграмм чат группы pydata

Size: a a a

Python для анализа данных

2683 membersпожаловаться на группу

2021 December 07

Aleksey Mochalov in Python для анализа данных

Пивотом можно попробовать)

источник

10:30пожаловаться #1

Pavel Zheltouhov in Python для анализа данных

Приказ за подписью генерального "с сегодняшнего для все уважают данные"

источник

10:33пожаловаться #2

Александр in Python для анализа данных

Ну да, но ни как не пойму как собрать эти столбцы План, Факт, они с разными номерами получаются, при трансформации из екселя он их автоматически нумерует, План1, Факт1, План2 , Факт2 и т.д.

источник

10:35пожаловаться #3

Артём Сучков... in Python для анализа данных

Добрый день. В вашем примере можно в несколько кликов:
1. Выделяет массив, который нужно преобразовать,
2.курсор на свободные ячейки
3. Правая кнопка мыши / Параметры вставки / Транспонировать

Если массив небольшой, но есть кросс-формулы, то сначала продублировать его в виде значений (ПКМ / Параметры вставки / Значения), а затем уже Транспонировать. Формулы можно закрепить при помощи добавления знака $ к столбцу или строке. (Эта функция позволяет оставлять ссылку на исходную ячейку при копировании массивов без смещения, как это любит делать Excel по умолчанию).

Если массив большой, в таблице есть ссылки на другие массивы с вложенными формулами и макросами и другими линкамт то лучше через Power Pivot

источник

10:52пожаловаться #4

Александр in Python для анализа данных

Артем спасибо, но мне нужно преобразовать файл в Pythone, через скрипт, без ручной обработки.

источник

10:54пожаловаться #5

Александр in Python для анализа данных

Кстати, это требование заказчика ...
Имею ввиду первый формат таблицы.

источник

11:02пожаловаться #6

Pavel Zheltouhov in Python для анализа данных

Ну он же собирается как-то попасть в информационную эру вместе с конкурентами, которые уже хранят таблично? вот пусть старается.

источник

11:03пожаловаться #7

Pavel Zheltouhov in Python для анализа данных

посмотрите тут картинки, найдите похожую на свою и используйте нужную функцию

https://pandas.pydata.org/pandas-docs/stable/user_guide/reshaping.html

источник

11:05пожаловаться #8

Александр in Python для анализа данных

Спасибо))

источник

11:05пожаловаться #9

Valerii Mamontov in Python для анализа данных

Здравствуйте, можно попробовать так:

import pandas as pd

data = [['sasha', 'male', 1, 0, 1, 2, 2, 1, 3, 2],
        ['oleg', 'male', 2, 1, 4, 5, 2, 1, 4, 2]]

df = pd.DataFrame(data)
df.columns = [f'col_{i}' for i in range(df.shape[1])]
print(df)

df2 = pd.melt(df, ['col_0', 'col_1'])
print(df2)

источник

11:09пожаловаться #10

Птица in Python для анализа данных

Для тех, кто интересуется бизнес / системным анализом

✅ Рекомендую канал – Business | System analyst, где ежедневно публикуются обучающие материалы и полезные статьи, с помощью которых ты прокачаешь hard и soft skills в сфере бизнес/системного анализа.

Доя примера делимся небольшой подборкой статей:
▪️ Системный и бизнес-аналитик: пошаговый гайд к востребованной профессии;
▪️ Типичный Agile спринт - Сатира;
▪️ Как проводить интервью с заказчиком;

источник

13:48пожаловаться #11

mrx in Python для анализа данных

привет! товарищи, подскажите, есть сломанный csv (точнее semicolon sv :) ), поскольку затесались в него из базы переносы строк.
при этом количество колонок каждый раз одинаковое. нет ли возможности в pandas как-то загружать игнорируя переносы строк, задав ожидаемое количество значений в строке?

источник

14:35пожаловаться #12

3ldar in Python для анализа данных

https://stackoverflow.com/questions/39649218/importing-csv-file-with-line-breaks-to-r-or-python-pandas

Stack Overflow

Importing csv file with line breaks to R or Python Pandas

I have a csv file that includes line breaks within columns:

"id","comment","x"
1,"ABC\"xyz",123
2,"xyz\"abc",543
3,"abc
xyz",483
ID 3, for example contains such a line break.

How can this be imp...

источник

14:36пожаловаться #13

mrx in Python для анализа данных

кажется у меня проблема все же не в эскейпленых кавычках, судя по данным

источник

14:44пожаловаться #14

Александр in Python для анализа данных

И снова я, с простым вопросом, что то вылетело из головы. Есть ДФ, нужно что бы в столбце А напротив всех планов стояла 1, а на против всех Фактов 2

источник

14:48пожаловаться #15

Александр in Python для анализа данных

Накорябал функцию, но она что то не сохраняет..

источник

14:49пожаловаться #16

3ldar in Python для анализа данных

Но вы же поняли, в какую сторону копать? https://stackoverflow.com/questions/52366670/handle-unwanted-line-breaks-with-read-csv-in-pandas

Stack Overflow

Handle unwanted line breaks with read_csv in Pandas

I have a problem with data that is exported from SAP. Sometimes you can find a line break in the posting text. What should be in one line, is then in two and this results in a pretty bad data frame...

источник

14:49пожаловаться #17

3ldar in Python для анализа данных

Попробуйте np.where

источник

14:50пожаловаться #18

Vladislav Filippov in Python для анализа данных

или replace
https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.replace.html

примерно так
piv["B"] = piv["B"].replace({"План" : 1, "Факт" : 2})

источник

14:50пожаловаться #19

mrx in Python для анализа данных

ну или по старинке

piv[piv['B'] == "План"]]["A"] = 1
piv[piv['B'] == "Факт"]]["A"] = 2

источник

14:53пожаловаться #20