Size: a a a

Python для анализа данных

2020 November 16

А

Алексей in Python для анализа данных
ну да, у тебя в Excel только целые
источник

R

Ruslan in Python для анализа данных
источник

R

Ruslan in Python для анализа данных
я если честно не помню как в питон по столбцам закинуть неделю. там кажется функция pivot была. но в целом все совпадает. различий не должно быть. а если они и есть то наверное в каких то там 10 тысячных знаках после запятой. для LFL это не так важно
источник

А

Алексей in Python для анализа данных
Ruslan видишь несовпадения в цифрах?
источник

А

Алексей in Python для анализа данных
Ruslan хотя...погоди
источник

R

Ruslan in Python для анализа данных
нет расхождений
источник

R

Ruslan in Python для анализа данных
ну или подсвети пжл
источник

А

Алексей in Python для анализа данных
Ruslan у меня Pandas c  твоим не совпадает
источник

А

Алексей in Python для анализа данных
я через pivot_table делал
источник

R

Ruslan in Python для анализа данных
а ты попробуй сделать через group by
источник

R

Ruslan in Python для анализа данных
если различия есть, то значит ты что то не так делаешь
источник

R

Ruslan in Python для анализа данных
если нет различий, то значит это специфика pivot_table
источник

А

Алексей in Python для анализа данных
Ruslan у меня задача вывести like for like 14 к 14 и 15 к 15 и потом еще разницу между ними вывести
источник

А

Алексей in Python для анализа данных
а ты сразу фильтруешь фрейм по одну неделю
источник

А

Алексей in Python для анализа данных
я сначала через pivot_table сделал так, чтобы недели лежали не в строках, в столбцах
источник

А

Алексей in Python для анализа данных
источник

А

Алексей in Python для анализа данных
Ruslan вот ноут
источник

R

Ruslan in Python для анализа данных
import pandas as pd
import numpy as np
df = pd.read_excel('magnit.xlsx', sheet_name='Данные')
df_result = df.pivot_table(index=['REGION'],
                          values=['SALE', 'SALE_PREV_YR'],
                          columns='WEEK_ID_2', aggfunc=np.sum).reset_index()

df_result.columns = [
   'REGION',
   'SALE_202014',
   'SALE_202015',
   'SALE_PREV_YR_202014',
   'SALE_PREV_YR_202015']
df_result['lfl_sale_202014'] = (df_result['SALE_202014'] / df_result['SALE_PREV_YR_202014'])
df_result.sort_values('lfl_sale_202014', ascending=False)
источник

R

Ruslan in Python для анализа данных
все совпало
источник

R

Ruslan in Python для анализа данных
проверил на 2014 годе
источник