Size: a a a

Python для анализа данных

2021 July 30

h

helby in Python для анализа данных
DAX не принимает данные

В Power Query вы имеет ввиду

Но Power BI имеет ограничение на вес отчета в 1 гб
источник

Z

Zurab in Python для анализа данных
через PQ данные попадают в DAX.
1 гб, но они хорошенько так сжимаются.
источник

h

helby in Python для анализа данных
Ну в любом случае

Пандас это бесплатно)
источник

Z

Zurab in Python для анализа данных
PBI тоже на одного)
источник

h

helby in Python для анализа данных
зависит от оперативки

создатель Pandas сам говорит, что вам нужно в 10 раз больше опертивной памяти, чем весит ваш датасет
источник

Z

Zurab in Python для анализа данных
и порог входа достаточно высокий
источник

h

helby in Python для анализа данных
Сомнительное утверждение)
источник

v

v in Python для анализа данных
У меня получилось что средняя цсв-шка должна быть где-то 100-200 байт на строку (с учетом что юникод 2-4 бита за знак), значит если на машине 8 свободных гб, это порядка 400млн рядов. Верно?
А, если в 10 раз меньше, значит в районе 40 млн рядов, плюс-минус порядок.
источник

Z

Zurab in Python для анализа данных
интересно, запомню
источник

h

helby in Python для анализа данных
источник

VM

Valerii Mamontov in Python для анализа данных
классно! я тоже не знал об этом)
источник

h

helby in Python для анализа данных
Выше статью кинул, от МакКини, создателя Панд

Почитайте, занимательно
источник

VM

Valerii Mamontov in Python для анализа данных
можно ещё проще:
list_tuples = [(1, 2), (3, 4), (100, 20), (23, 23)]

with open('file.csv', 'a') as file:
   for my_tuple in list_tuples:
       a, b = my_tuple
       file.write(f'{a};{b}\n')
источник

v

v in Python для анализа данных
Какой у вас любимый ресурс куда вы лезете с вопросом "как лучше всего сделать X в пандах?". С учетом того, что часто одну и ту же вещь можно сделать 2-3 разными способами.
У меня пока только очевидные доки панд и стековерфлоу.
источник

h

helby in Python для анализа данных
гугл в целом, наверное
источник

PZ

Pavel Zheltouhov in Python для анализа данных
Очевидно, что аналитик должен понимать как работает гугл и предпочитать гугл.
Разве stackoverflow в состоянии сам сделать поиск по себе?
источник

PZ

Pavel Zheltouhov in Python для анализа данных
А хотя есть еще один важный момент:
программирование по stackoverflow решает конкретные задачи, но не развивает понимание и память.
источник

IS

Ilya Shutov in Python для анализа данных
Книги? Разные кукбуки для этого дела хороши
источник

IS

Ilya Shutov in Python для анализа данных
Отнюдь. На SO иногда такие подробные разборы есть, что иные лекции в подметки не годятся. Наблюдение в отрыве от частной библиотеки, в целом.
источник

IS

Ilya Shutov in Python для анализа данных
Не совсем, надо по внутренним представлениям типов данных считать. Но в целом подход к оценке верный. И правда, пандас далеко не лучший инструмент, особенно для больших объемов. Wes подробно объясняет почему так получилось. Blockmanager, …
источник