Size: a a a

Python для анализа данных

2020 November 20

R

Ruslan in Python для анализа данных
Если у вас Пентиум то да
источник

R

Ruslan in Python для анализа данных
Если комп более менее
источник

R

Ruslan in Python для анализа данных
То думаю строк 10 млн не больше 10 сек обработаешь
источник

R

Ruslan in Python для анализа данных
Обработает
источник

R

Ruslan in Python для анализа данных
Ну вы кстати можете в отдельный датафрейм вынести данные с пропущенными значениям эти
источник

ND

Natalya Davydova in Python для анализа данных
а профит в чем будет? потом мержить
источник

R

Ruslan in Python для анализа данных
И позже после того как замените медианами пропуски присоедините обратно
источник

ND

Natalya Davydova in Python для анализа данных
быстрее?
источник

R

Ruslan in Python для анализа данных
Мержить не надо. Надо будет присоединить снизу
источник

R

Ruslan in Python для анализа данных
Да будет быстрее если прям у вас реально огромный датасет
источник

R

Ruslan in Python для анализа данных
Но если речь о 5 млн строк и 200 столбцах то проблем быть не должно
источник

ND

Natalya Davydova in Python для анализа данных
Ок, поняла. Сейчас попробую. Спасибо
источник

R

Ruslan in Python для анализа данных
Для присоединения кажется метод append
источник

ВК

Владимир Калинин... in Python для анализа данных
посмотрите на метод transform
источник

А

Алексей in Python для анализа данных
А loc не поможет в фильтрации и применении функции на отфильтрованный диапазон?
источник

R

Ruslan in Python для анализа данных
Владимир Калинин
посмотрите на метод transform
Классная штука,  бегло прочитал и вроде как понял это аналог over из sql. Тот же функционал
источник
2020 November 21

R

Ruslan in Python для анализа данных
Алексей
А loc не поможет в фильтрации и применении функции на отфильтрованный диапазон?
Пока не могу себе представить как такое реализовать
источник

А

Алексей in Python для анализа данных
Ruslan
Пока не могу себе представить как такое реализовать
df.loc[df['shield'] > 35] = df.apply(row, axis=1)
где df['shield'] > 35 - условие
источник

А

Алексей in Python для анализа данных
или вот так
df.loc[df['shield'] > 35] = df.loc[df['shield'] > 35].apply(row, axis=1)
источник

R

Ruslan in Python для анализа данных
row функция ?
источник