Size: a a a

Python для анализа данных

2021 February 28

A

Artem in Python для анализа данных
Madiar Isabek
Ребят у кого нибудь есть книги по теории вероятностей ?
Держи. Их там полно https://vk.com/club186208863
источник
2021 March 01

V

Valentine in Python для анализа данных
Всем привет. Такой вопрос, а какие есть способы заполнения пустых, категориальных значений, кроме средниквадратичного и случайного заполнения?
источник

PZ

Pavel Zheltouhov in Python для анализа данных
Valentine
Всем привет. Такой вопрос, а какие есть способы заполнения пустых, категориальных значений, кроме средниквадратичного и случайного заполнения?
может плюнуть и градиентное дерево влепить?
источник

PZ

Pavel Zheltouhov in Python для анализа данных
подозреваю, что это очень популярно
источник

V

Valentine in Python для анализа данных
Pavel Zheltouhov
может плюнуть и градиентное дерево влепить?
Ахах. Мне просто этот вопрос мучил довольно таки долго. Очевидно же есть что-то помощнее чем удаление или заполнение средним
источник

PZ

Pavel Zheltouhov in Python для анализа данных
Valentine
Ахах. Мне просто этот вопрос мучил довольно таки долго. Очевидно же есть что-то помощнее чем удаление или заполнение средним
я методичку открыл и там написано - делай xgboost
источник

PZ

Pavel Zheltouhov in Python для анализа данных
"A Short Guide for Feature Engineering and Feature Selection.pdf"
источник

V

Valentine in Python для анализа данных
Pavel Zheltouhov
я методичку открыл и там написано - делай xgboost
Бустинг у нас будет этакой панацеей в мире алгоритмов?
источник

I

Igor in Python для анализа данных
Valentine
Всем привет. Такой вопрос, а какие есть способы заполнения пустых, категориальных значений, кроме средниквадратичного и случайного заполнения?
Cold/Hot Deck imputation?
источник

PZ

Pavel Zheltouhov in Python для анализа данных
Valentine
Бустинг у нас будет этакой панацеей в мире алгоритмов?
ага.  
причем, по другой методичке , Max Kuhn, где есть табличка со всеми классическими методами и открыв ее сразу становится очевидно,  что xgboost в принципе не требует возни
источник

ЕС

Егор Сергеевич... in Python для анализа данных
Valentine
Всем привет. Такой вопрос, а какие есть способы заполнения пустых, категориальных значений, кроме средниквадратичного и случайного заполнения?
1) Категория "нет уатегории" и перевести в даммис как обычно
2) Impute встроенными методами или какой-нибудь регрессией по известным переменным
3) Самая частая категория
4) Медиана
источник

PZ

Pavel Zheltouhov in Python для анализа данных
почему в вашем яндексе методички то не раздают?
источник

V

Valentine in Python для анализа данных
Igor
Cold/Hot Deck imputation?
Стоит почитать, спасибо
источник

V

Valentine in Python для анализа данных
Егор Сергеевич
1) Категория "нет уатегории" и перевести в даммис как обычно
2) Impute встроенными методами или какой-нибудь регрессией по известным переменным
3) Самая частая категория
4) Медиана
Спасибо
источник

PZ

Pavel Zheltouhov in Python для анализа данных
Valentine
Ахах. Мне просто этот вопрос мучил довольно таки долго. Очевидно же есть что-то помощнее чем удаление или заполнение средним
http://core.ecu.edu/omgt/krosj/IMDSDataMining2003.pdf
из методички. букв много.
источник

V

Valentine in Python для анализа данных
Ох, у меня еще свои недочитаны
источник

PZ

Pavel Zheltouhov in Python для анализа данных
Valentine
Ох, у меня еще свои недочитаны
а у вас какие?  вы эти две используйте.
вот я сейчас погуглил что-то типа "summary of machine learning models" и ничего толкового не нахожу.
происходит "бустинг хреновых знаний в гугле".
источник

PZ

Pavel Zheltouhov in Python для анализа данных
профессионалам, помнящим на память все свойства алгоритмов, ответ на этот вопрос не нужен.
а новички тыкают во что попало и гугл выталкивает их результаты повыше.
источник

I

Igor in Python для анализа данных
Pavel Zheltouhov
профессионалам, помнящим на память все свойства алгоритмов, ответ на этот вопрос не нужен.
а новички тыкают во что попало и гугл выталкивает их результаты повыше.
Если достаточно много потыкать, то можно и на что-то толковое выйти))) Просто, да, сейчас с большим количеством блогов и всего остального, каждый, кто прошёл один онлайн-курс по чему бы то не было считает нужным написать туториал (даже попадались идеи о проведении факторного анализа с помощью бустинга). Ну, а потом кто-то прочитает этот туториал и напишет свой и т.д.
источник

PZ

Pavel Zheltouhov in Python для анализа данных
В соседнем чате с сисдаминами веселее. у них бот вместо капчи задает вопрос стебный и холиварный :  "На каком порту работает пинг?"
правильный ответ - обсудить уместность этой формулировки вопроса, но люди просто гуглят, получают ответ 7  и гугл снова бустит этот ответ.
не знаю точно как этот бот настроен. кажется, просто ожидает любой ответ. спамеры в телеграме обычно просто не заморачиваются ответами.
источник