Size: a a a

Python для анализа данных

2020 December 17

DK

Dmitry Kartashov in Python для анализа данных
Питон построчно может все схавать вроде как
источник

M

Mikhail in Python для анализа данных
Dmitry Kartashov
Питон построчно может все схавать вроде как
Нет, датафрейм должен в память влезть + место на операции
источник

DK

Dmitry Kartashov in Python для анализа данных
Mikhail
Нет, датафрейм должен в память влезть + место на операции
Так это если пандас
А если просто файл читать построчно
источник

M

Mikhail in Python для анализа данных
ну человек про пандас вопрос задал. и дело же в том чтобы обработать, а не только прочитать
источник

DK

Dmitry Kartashov in Python для анализа данных
Я больше к тому, что если затык в помещении в память, можно пробовать читать и обрабатывать построчно, если это возможно
источник

DK

Dmitry Kartashov in Python для анализа данных
Это далеко не всегда поможет, но мало ли
источник

M

Mikhail in Python для анализа данных
можно
источник

M

Mikhail in Python для анализа данных
но это будет велосипед, который  уже реализован в dask нормально; поэтому если нет ограничений на зависимости, лучше его взять
источник

DK

Dmitry Kartashov in Python для анализа данных
Понятно, спасибо за разъяснение
источник

Д

Дмитрий in Python для анализа данных
Народ, почему более трёх and после if в цикле не воспринимает? хочу отфильтровать по 3ём условиям, как это сделать в этом цикле без особых костылей ?

def type_box(row):
   if row['MaxSide'] <= 460 and row['MeanSide'] <= 330 and row['MinSide'] <= 290:
       return 'Blue box'
   if 460 < row['MaxSide'] <= 660 and 330 < row['MeanSide'] <= 490 and 290 < row['MinSide'] <= 355:
       return 'Black box'
   if row['pcs'] == 2 and 460 < row['MaxSide'] <= 660 and 330 < row['MeanSide'] <= 490 and 290 < row['MinSide'] <= 355:
       return 'Black box 2 pcs'
   else:
       return 'another'
источник

Д

Дмитрий in Python для анализа данных
то есть у меня он не возращает Black box 2 pcs, по моим догадкам, т.к. более 3х end стоит
источник

PS

Pavel Samokhvalov in Python для анализа данных
а ничего, что пересекаются диапазоны?
источник

PS

Pavel Samokhvalov in Python для анализа данных
290 - X - 355 и 330 - X - 490. Такое условие вообще возможно?
источник

Д

Дмитрий in Python для анализа данных
не там MaxSide MeanSide MinSide
источник

Д

Дмитрий in Python для анализа данных
разные стороны
источник

PS

Pavel Samokhvalov in Python для анализа данных
а, сорри, не заметил
источник

Д

Дмитрий in Python для анализа данных
по факту если потом фильтровать отдельно через лок или квери по штукам, всё считается, но я хочу в цикле сразу ранжировать
источник

PS

Pavel Samokhvalov in Python для анализа данных
а после наложения какого из 4 условий перестаёт возвращать?
источник

KM

Konstantin Mohov in Python для анализа данных
Заключи условие в скобки
источник

Д

Дмитрий in Python для анализа данных
хм, хотя если убирать второе условие работает
источник