Size: a a a

Python для анализа данных

2018 December 27

АМ

Алексей Макаров... in Python для анализа данных
По поводу нужно ли: я вижу в method chaining только удобство для понимания пайплайна обработки данных. Удобно, когда нужно с кем-то поделиться ноутбуком
источник

АМ

Алексей Макаров... in Python для анализа данных
Выше как-то обсуждали: https://t.me/pydata_chat/47
источник

VN

Vlad Nykytenko in Python для анализа данных
Всем привет.
А можете пожалуйста подказать, почему таким способом не заполняются  NA?
train_df[cat_feat] = train_df[cat_feat].fillna(train_df[cat_feat].mode().T)
источник

АМ

Алексей Макаров... in Python для анализа данных
mode насколько мне известно возвращает series, а не одно значение. Такое бывает, когда модальное значение не одно в series. То есть вы пытаетесь сделать fillna не одним value, а series
источник

АМ

Алексей Макаров... in Python для анализа данных
Так что попробуйте сделать так, чтобы бралось только одно модальное значение
источник

AL

Aleksey Laptev in Python для анализа данных
Константин
всем привет.
новичок в python пока всему только учусь.
подскажите можно ли описанную ниже задачу обернуть в последовательное выполнение (видел примеры как с pipe работают или через цепочки вызывают выполнение) и нужно ли?

logs.columns = ['ip', 'drop1', 'date','url', 'status', 'drop2', 'referrer', 'userAgent', 'drop3', 'drop4','drop5', 'domain']
logs = logs.drop(['drop1', 'drop2', 'drop3', 'drop4','drop5'], axis=1)
logs['url'] = logs['url'].map(lambda x: re.sub('\s|GET|HTTP\/1.1|POST','', str(x)))
logs['date'] = logs['date'].map(lambda x: re.sub('\[|\]|\+0300|\s','', x))
за такой код в мире программистов руки выкручивать надо )

может курс сделать азы ООП-БД? Все реально проще станет )
источник

AL

Aleksey Laptev in Python для анализа данных
причина - код не читабельный, сам потом не поймешь что там
источник

VN

Vlad Nykytenko in Python для анализа данных
я столкнулся с этой проблемой именно с категориальными фичами
я делал тоже самое с num_feat, и все работало
источник

VN

Vlad Nykytenko in Python для анализа данных
ок, спасибо, попробую
источник

VN

Vlad Nykytenko in Python для анализа данных
Переслано от Алексей Макаров...
Так что попробуйте сделать так, чтобы бралось только одно модальное значение
источник

АМ

Алексей Макаров... in Python для анализа данных
Vlad Nykytenko
я столкнулся с этой проблемой именно с категориальными фичами
я делал тоже самое с num_feat, и все работало
Посмотрите что возвращается в train_df[cat_feat].mode()
источник

VN

Vlad Nykytenko in Python для анализа данных
возвращает строку с модальными значениями, поэтому использовал транспонирование
источник

АМ

Алексей Макаров... in Python для анализа данных
Строку или series? Скиньте output ячейки
источник

VN

Vlad Nykytenko in Python для анализа данных
train_df[cat_feat].mode()
источник

VN

Vlad Nykytenko in Python для анализа данных
train_df[cat_feat].mode().T
источник

АМ

Алексей Макаров... in Python для анализа данных
Кажется я понял. Вы хотите заполнить колонку модальным значением этой колонки?
источник

VN

Vlad Nykytenko in Python для анализа данных
да, так и хочу сделать
источник

АМ

Алексей Макаров... in Python для анализа данных
Тогда вам mode надо с параметром axis=1 передавать
источник

VN

Vlad Nykytenko in Python для анализа данных
сейчас попробую, спасибо
источник

АМ

Алексей Макаров... in Python для анализа данных
Как попробуйте - напишите что получилось)
источник