Size: a a a

Python для анализа данных

2021 November 15

h

helby in Python для анализа данных
источник

h

helby in Python для анализа данных
источник

IS

Ilya Shutov in Python для анализа данных
мне кажется, что что-то не то.
две колонки надо: id и var, длинное представление.
а тут те же 0.5 секунды получаются?
источник

h

helby in Python для анализа данных
да
источник

h

helby in Python для анализа данных
Теперь верно?
источник

IS

Ilya Shutov in Python для анализа данных
это исходный формат
источник

IS

Ilya Shutov in Python для анализа данных
источник

h

helby in Python для анализа данных
ну исходный формат был - словарь?
верно же
От него нужно было придти к датафрейму вида как указано
источник

h

helby in Python для анализа данных
Был такой словарь
источник

h

helby in Python для анализа данных
Создал так же словарь формата key : ['elem ' for i in range(0,100,1)]
на 100_000 ключей

Преобразование в датафрейм заняло :
источник
2021 November 16

E

Ekaterina in Python для анализа данных
Добрый день. Есть данные в сводных таблицах excel. Задача, выбирать одно из значений, проваливаться в полотно исходных данных и сохранять этот лист с данными в отдельную книгу excel. Возможно ли это сделать средствами python?
источник

AG

Arsen Gumin in Python для анализа данных
Кто как решает проблему, если pd.json_normalize не все разворачивает, там ещё уровня 3-4 остаётся
источник

EZ

Egor Zhulanov in Python для анализа данных
Вот так, но предлагали вариант проще: можно поискать по дате от 12го августа ответ Ильи Шутова в 21:02
мое решение было такое:
df = json_normalize(test)
pallet = pd.DataFrame(columns = ["sscc","packing_date","owner_id","owner_organization_name","childs"])
pachka = pd.DataFrame(columns = ["sgtin","sscc","status","gtin","expiration_date","batch","pallet"])
for i in range(len(json_normalize(test))):
   sscc = json_normalize(test[i]["down"])
   pallet = pd.concat([pallet,sscc]).reset_index(drop=True)
for i in range(len(pallet)):
   df_sgtin = json_normalize(test[i]["down"]["childs"],["childs"])
   df_sgtin["pallet"] = "Nan"
   for f in range(len(df_sgtin)):
       df_sgtin["pallet"][f] = pallet["sscc"][i]
   pachka = pd.concat([pachka,df_sgtin]).reset_index(drop=True)
источник

AG

Arsen Gumin in Python для анализа данных
Спасибо! Я почти так делал, но кое что подсмотрел) пойду 12 августа смотреть)
источник

VM

Valerii Mamontov in Python для анализа данных
доброе утро!
я бы вот так cделал
источник

AG

Arsen Gumin in Python для анализа данных
Чтение файла долгая тема, нарушает частоту эксперимента, нет?)
источник

VM

Valerii Mamontov in Python для анализа данных
наверное нарушает))
источник

AG

Arsen Gumin in Python для анализа данных
Лучше начинать считать время после чтения из файла)
источник

I

Igor in Python для анализа данных
Так это же совсем не то что нужно было)) То, что сделано на картинке, по сути можно было упростить во много раз. + ключ явно же отделен от значений знаком '=', зачем слайс то делать)
источник

VM

Valerii Mamontov in Python для анализа данных
там всё равно итоговое время одна секунда
даже с чтением файла

UPD:
размер файла всего 8 мегабайт и его чтение заняло доли секунд
источник