Size: a a a

Machine learning

2020 June 19

y

yithian in Machine learning
Решений нет. А то что там народ напредлагал - просто недоразумения.)
источник

PS

Pavel Savin in Machine learning
Не думал, что эту задачу воспримут так серьёзно
источник

AG

Artyom Gruzdev in Machine learning
Sergey Salnikov
из градиентных бустингов категориальные признаки "из-коробки" поддерживает только catboost.
lightGBM умеет, используется алгоритм Фишера http://www.csiss.org/SPACE/workshops/2004/SAC/files/fisher.pdf
источник

SS

Sergey Salnikov in Machine learning
а, ну да, но там не то чтобы прям сразу "из-коробки", надо будет привести к числу.
источник

RN

Ruslan Nasonov in Machine learning
Привет. Возможно не по теме — а кто какие знает морфологические анализаторы для русского языка (нужно для лемматизации)? Я вот кроме Mystem и Pymorphy ничего толкового не находил.
источник
2020 June 20

DY

Dmitry Yudaev in Machine learning
источник

OR

Oleg Ruban in Machine learning
Ruslan Nasonov
Привет. Возможно не по теме — а кто какие знает морфологические анализаторы для русского языка (нужно для лемматизации)? Я вот кроме Mystem и Pymorphy ничего толкового не находил.
wordnet, но PyMystem лучше
источник

V

Vit in Machine learning
Ребят, привет. Отвлеченный вопрос не по курсу. Раньше, при read_sql/excel, даты читались с типом datetime. Потом мне обновили анаконду на новую версию (Видимо, и питон тоже. Версии сейчас не скажу) и даты стали читаться с типом np.datetime64. В атрибутах чего-то не заметил признака для определения типов навскидку. Впрочем, вроде можно dtypes ={} использовать. Но это сейчас в голову пришло, возможно он будет конфликтовать с атрибутом parse_dates.

В общем, два вопроса:
1) есть ли возможность читать с типом datetime.
2) может лучше все перевести на нампай? Мб он легче, перспективнее и вообще самый лучший.
Спасибо
источник

ЯШ

Ярик Шаталов... in Machine learning
Vit
Ребят, привет. Отвлеченный вопрос не по курсу. Раньше, при read_sql/excel, даты читались с типом datetime. Потом мне обновили анаконду на новую версию (Видимо, и питон тоже. Версии сейчас не скажу) и даты стали читаться с типом np.datetime64. В атрибутах чего-то не заметил признака для определения типов навскидку. Впрочем, вроде можно dtypes ={} использовать. Но это сейчас в голову пришло, возможно он будет конфликтовать с атрибутом parse_dates.

В общем, два вопроса:
1) есть ли возможность читать с типом datetime.
2) может лучше все перевести на нампай? Мб он легче, перспективнее и вообще самый лучший.
Спасибо
И можно я добавлю? Как лучше переводить всю колонку в datetime? Наверняка есть стандартные способы
источник

ФР

Фёдор Родионов... in Machine learning
Ярик Шаталов
И можно я добавлю? Как лучше переводить всю колонку в datetime? Наверняка есть стандартные способы
о них даже в первую неделю первого курса говорили
источник

V

Vit in Machine learning
Из текста to_datetime или strptime, например
источник

ЯШ

Ярик Шаталов... in Machine learning
Фёдор Родионов
о них даже в первую неделю первого курса говорили
Да, но, там используется пандовский to_datetime, который просит на вход строку, соответственно это нужно делать через apply, с преобразованием строки с датой к нужному виду. А ещё способы есть?
источник

A

Aroh in Machine learning
вы что-то не то говорите
источник

V

Vit in Machine learning
Если я ничего не путаю, можно к series применить to_datetime()
источник

V

Vit in Machine learning
Хотя, давно так не делал, мб ошибаюсь
источник

A

Aroh in Machine learning
Ну и при read_csv можно явно указать, что колонка имеет тип дата
источник

A

Aroh in Machine learning
newData = pd.read_csv('Russia.csv', parse_dates=['Дата'], dayfirst=True) например
источник

V

Vit in Machine learning
Aroh
newData = pd.read_csv('Russia.csv', parse_dates=['Дата'], dayfirst=True) например
Да, так в том и вопрс, что раньше он возвращал дату datetime, а после обновления стал np.datetime64
источник

ЯШ

Ярик Шаталов... in Machine learning
Они в "первой неделе" используют of.datetime(1985, 1, 1), передают в неё числа, получают формат даты. Серии и строки она на вход не принимает. Честно, не помню про to_datetime, какие там ограничения
источник

A

Aroh in Machine learning
аа, ну я просто с этим типом даты и работаю
источник