Size: a a a

Python для анализа данных

2021 December 07

AM

Aleksey Mochalov in Python для анализа данных
Пивотом можно попробовать)
источник

PZ

Pavel Zheltouhov in Python для анализа данных
Приказ за подписью генерального "с сегодняшнего для все уважают данные"
источник

А

Александр in Python для анализа данных
Ну да, но ни как не пойму как собрать эти столбцы План, Факт, они с разными номерами получаются, при трансформации из екселя он их автоматически нумерует, План1, Факт1, План2 , Факт2 и т.д.
источник

А

Артём Сучков... in Python для анализа данных
Добрый день. В вашем примере можно в несколько кликов:
1. Выделяет массив, который нужно преобразовать,
2.курсор на свободные ячейки
3. Правая кнопка мыши / Параметры вставки / Транспонировать

Если массив небольшой, но есть кросс-формулы, то сначала продублировать его в виде значений (ПКМ / Параметры вставки / Значения), а затем уже Транспонировать. Формулы можно закрепить при помощи добавления знака $ к столбцу или строке. (Эта функция позволяет оставлять ссылку на исходную ячейку при копировании массивов без смещения, как это любит делать Excel по умолчанию).

Если массив большой, в таблице есть ссылки на другие массивы с вложенными формулами и макросами и другими линкамт то лучше через Power Pivot
источник

А

Александр in Python для анализа данных
Артем спасибо, но мне нужно преобразовать файл в Pythone, через скрипт, без ручной обработки.
источник

А

Александр in Python для анализа данных
Кстати, это требование заказчика ...
Имею ввиду первый формат таблицы.
источник

PZ

Pavel Zheltouhov in Python для анализа данных
Ну он же собирается как-то попасть в информационную эру вместе с конкурентами, которые уже хранят таблично? вот пусть старается.
источник

PZ

Pavel Zheltouhov in Python для анализа данных
посмотрите тут картинки, найдите похожую на  свою и используйте нужную функцию

https://pandas.pydata.org/pandas-docs/stable/user_guide/reshaping.html
источник

А

Александр in Python для анализа данных
Спасибо))
источник

VM

Valerii Mamontov in Python для анализа данных
Здравствуйте, можно попробовать так:
import pandas as pd

data = [['sasha', 'male', 1, 0, 1, 2, 2, 1, 3, 2],
       ['oleg', 'male', 2, 1, 4, 5, 2, 1, 4, 2]]

df = pd.DataFrame(data)
df.columns = [f'col_{i}' for i in range(df.shape[1])]
print(df)

df2 = pd.melt(df, ['col_0', 'col_1'])
print(df2)
источник

П

Птица in Python для анализа данных
Для тех, кто интересуется бизнес / системным анализом

✅ Рекомендую канал – Business | System analyst, где ежедневно публикуются обучающие материалы и полезные статьи, с помощью которых ты прокачаешь hard и soft skills в сфере бизнес/системного анализа.

Доя примера делимся небольшой подборкой статей:
▪️ Системный и бизнес-аналитик: пошаговый гайд к востребованной профессии;
▪️ Типичный Agile спринт - Сатира;
▪️ Как проводить интервью с заказчиком;
источник

m

mrx in Python для анализа данных
привет! товарищи, подскажите, есть сломанный csv (точнее semicolon sv :) ), поскольку затесались в него из базы переносы строк.
при этом количество колонок каждый раз одинаковое. нет ли возможности в pandas как-то загружать игнорируя переносы строк, задав ожидаемое количество значений в строке?
источник

3

3ldar in Python для анализа данных
источник

m

mrx in Python для анализа данных
кажется у меня проблема все же не в эскейпленых кавычках, судя по данным
источник

А

Александр in Python для анализа данных
И снова я, с простым вопросом, что то вылетело из головы. Есть ДФ, нужно что бы в столбце А напротив всех планов стояла 1, а на против всех Фактов 2
источник

А

Александр in Python для анализа данных
Накорябал функцию, но она что то не сохраняет..
источник

3

3ldar in Python для анализа данных
Но вы же поняли, в какую сторону копать? https://stackoverflow.com/questions/52366670/handle-unwanted-line-breaks-with-read-csv-in-pandas
источник

3

3ldar in Python для анализа данных
Попробуйте np.where
источник

VF

Vladislav Filippov in Python для анализа данных
или replace
https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.replace.html

примерно так
piv["B"] = piv["B"].replace({"План" : 1, "Факт" : 2})
источник

m

mrx in Python для анализа данных
ну или по старинке

piv[piv['B'] == "План"]]["A"] = 1
piv[piv['B'] == "Факт"]]["A"] = 2
источник