Size: a a a

Python для анализа данных

2021 November 14

v

v in Python для анализа данных
И по моим ощущениям он все равно быстрее чем если табличку делать на ванильных списках.
источник

v

v in Python для анализа данных
Про R я не заикаюсь вообще.
источник

IS

Ilya Shutov in Python для анализа данных
Пандас — угу. Это архитектурное дно
источник

v

v in Python для анализа данных
Недавно скидывали мне проект с датафреймами на либе polars, как он там?
источник

IS

Ilya Shutov in Python для анализа данных
Хорошая замена
источник

T

Tishka17 in Python для анализа данных
Если только с числами работать - возможно.
источник

v

v in Python для анализа данных
Ага, все что можно в сам массив засунуть вместо ссылки на значение. Со строками уже не выйдет.
источник

PZ

Pavel Zheltouhov in Python для анализа данных
О, проектирование jsonмешалок по ощущениям. Наше любимое.
источник

v

v in Python для анализа данных
Но в любом случае - те же матплотлиб с сиборном завязаны на нампи + пандас и пока не будет достойной альтернативы, фиг я от них уйду.
источник

v

v in Python для анализа данных
Ну я пытался недавно переписать куски кода, работающие со строками из таблицы, чтобы хранились в массивах. Так и не вышло ускорить, плюнул и оставил просто на ванильных итераторах. И это даже без пандас, там совсем шансов не было.
источник

PZ

Pavel Zheltouhov in Python для анализа данных
И это все чтобы я в Пятерочке должен каждый экземпляр молочка пробивать? Раньше то нормально было. А сейчас qr-коды уникальные.
Тьфу.
источник

AG

Arsen Gumin in Python для анализа данных
Посмотрел про polars, ждём релиза, интересно
источник
2021 November 15

IS

Ilya Shutov in Python для анализа данных
вопросик есть:
Как быстро прийти от списка вида
data = {'A' : ['X','Y','Z'], 'B' : 'X', 'C' : ['X','Z']}

К датафрейму вида
df = pd.DataFrame({
   'id': ['A', 'A', 'A', 'B', 'C', 'C'],
   'var': ['X', 'Y', 'Z', 'X', 'X', 'Z']})

Целевые количественные показатели:
- количество элементов в исходном словаре ~100K
- количество элементов  в списке в каждой позиции словаря ~50 (плавает от строки к строке)
- целевое временное окно преобразования ~1-3с
источник

M

Mikhail in Python для анализа данных
источник

M

Mikhail in Python для анализа данных
на производительность не проверял, лень данные генерить
источник

IS

Ilya Shutov in Python для анализа данных
важно соблюдение количественных показателей
основной вопрос именно к ним
источник

AD

Andrew Dakhnovsky in Python для анализа данных
пуэ пайтон
производительность не мерял
источник

M

Mikhail in Python для анализа данных
данные входные жёстко в виде дикта?
источник

IS

Ilya Shutov in Python для анализа данных
можно переформатировать.
по сути это файл в котором каждая строка вида:
A=X;Y;Z
если это как-то упрощает ситуацию
источник

IS

Ilya Shutov in Python для анализа данных
1-3 секунды — жёстко
источник