Телеграмм чат группы pydata

ну да, у тебя в Excel только целые

23:11пожаловаться #1

23:11пожаловаться #2

я если честно не помню как в питон по столбцам закинуть неделю. там кажется функция pivot была. но в целом все совпадает. различий не должно быть. а если они и есть то наверное в каких то там 10 тысячных знаках после запятой. для LFL это не так важно

23:12пожаловаться #3

Ruslan видишь несовпадения в цифрах?

23:12пожаловаться #4

Ruslan хотя...погоди

23:13пожаловаться #5

нет расхождений

23:13пожаловаться #6

ну или подсвети пжл

23:14пожаловаться #7

Ruslan у меня Pandas c твоим не совпадает

23:15пожаловаться #8

я через pivot_table делал

23:16пожаловаться #9

а ты попробуй сделать через group by

23:17пожаловаться #10

если различия есть, то значит ты что то не так делаешь

23:17пожаловаться #11

если нет различий, то значит это специфика pivot_table

23:17пожаловаться #12

Ruslan у меня задача вывести like for like 14 к 14 и 15 к 15 и потом еще разницу между ними вывести

23:18пожаловаться #13

а ты сразу фильтруешь фрейм по одну неделю

23:18пожаловаться #14

я сначала через pivot_table сделал так, чтобы недели лежали не в строках, в столбцах

23:19пожаловаться #15

magnit.ipynb

(5.86 Кб)

23:20пожаловаться #16

Ruslan вот ноут

23:21пожаловаться #17

import pandas as pd
import numpy as np
df = pd.read_excel('magnit.xlsx', sheet_name='Данные')
df_result = df.pivot_table(index=['REGION'],
values=['SALE', 'SALE_PREV_YR'],
columns='WEEK_ID_2', aggfunc=np.sum).reset_index()

df_result.columns = [
'REGION',
'SALE_202014',
'SALE_202015',
'SALE_PREV_YR_202014',
'SALE_PREV_YR_202015']
df_result['lfl_sale_202014'] = (df_result['SALE_202014'] / df_result['SALE_PREV_YR_202014'])
df_result.sort_values('lfl_sale_202014', ascending=False)

23:29пожаловаться #18

все совпало

23:29пожаловаться #19

проверил на 2014 годе