Size: a a a

AI / Big Data / Machine Learning

2020 January 09

АШ

Андрей Шахов in AI / Big Data / Machine Learning
Karev Vitaly
почему 22 гб оперативки для пустого?
в районе 3х же, не?
мне говорит нужно 22 :)
источник

KV

Karev Vitaly in AI / Big Data / Machine Learning
а ты смотрел, что он действительно кастит столбцы с bool как bool?
источник

АШ

Андрей Шахов in AI / Big Data / Machine Learning
уже проверил этот момент, bool он таки смог уместить
источник

ab

arsenii begliak in AI / Big Data / Machine Learning
Андрей Шахов
Всем привет. А кто-нибудь работал в pandas с dataframe размера 100к строк на 30к столбцов? основная масса данных - bool, пару столбцов только string
Проблема в том, что даже для нулевого фрейма такого размера нужно 22 гб оперативки :)
Кто-нибудь решал такую проблему?
Разные варианты есть. К тому, что уже предлагали: убедитесь, что используются правильные типы колонок. Не надо использовать int64 для булевых значений. Можно также обрабатывать датасет по частям, если это поможет в вашей задаче.
источник

КБ

Константин Белов in AI / Big Data / Machine Learning
Ребят, кто-то использовал язык ДРАКОН в своей работе/учебе ? Хочу узнать существует ли конвертер питона в дракон-питон ?
источник

R

Roman in AI / Big Data / Machine Learning
Андрей Шахов
Всем привет. А кто-нибудь работал в pandas с dataframe размера 100к строк на 30к столбцов? основная масса данных - bool, пару столбцов только string
Проблема в том, что даже для нулевого фрейма такого размера нужно 22 гб оперативки :)
Кто-нибудь решал такую проблему?
Что-то явно не так, это маленький датасет, и при импорте не должен столько занимать.
источник

R

Roman in AI / Big Data / Machine Learning
источник

R

Roman in AI / Big Data / Machine Learning
поиграйся с этой функцией, посмотри что жрет память
источник

R

Roman in AI / Big Data / Machine Learning
и еще при импорте - лучше всегда указывать явное приведение типа для каждой колонки, чтобы не было сюрпризов дальше на этапе процессинга
источник

R

Roman in AI / Big Data / Machine Learning
30к*100к = 3 ГБ если все bool , так как они занимают 1 байт, если же у вас True редко, используйте разреженный формат хранения, будет занимать меньше места в памяти и быстрее обрабатываться
источник

R

Roman in AI / Big Data / Machine Learning
8*3 = 24 ГБ - это если он пытается bool как int64 импортировать.
источник

NL

Night Lord in AI / Big Data / Machine Learning
Константин Белов
Ребят, кто-то использовал язык ДРАКОН в своей работе/учебе ? Хочу узнать существует ли конвертер питона в дракон-питон ?
Выключите бота
источник

КБ

Константин Белов in AI / Big Data / Machine Learning
Я не бот
источник

КБ

Константин Белов in AI / Big Data / Machine Learning
Этот язык ещё использовал сам начальник ис станции Бурана
источник

КБ

Константин Белов in AI / Big Data / Machine Learning
Космический кораблик знаете ли
источник

Z

ZveroBoy in AI / Big Data / Machine Learning
будь я бот, я бы так же сказал
источник

D🐈

Dan 🐈 Capybara in AI / Big Data / Machine Learning
Банить ботов! Чаты для человеков!
источник

D🐈

Dan 🐈 Capybara in AI / Big Data / Machine Learning
😆
источник

Λ

Λepus in AI / Big Data / Machine Learning
Dan 🐈 Capybara
Банить ботов! Чаты для человеков!
банить человеков, чаты для ботов.
Что ты не как за AI
источник

S

Stacy in AI / Big Data / Machine Learning
Интервал и размах в статистике это одно и тоже?
источник