Size: a a a

Machine learning

2020 June 01

D

Dmitrii in Machine learning
#C2W3 Задание 6
Не могу получить правильный ответ. Подскажите, верно ли выполняю задание, пожалуйста:
1. Из вещественных признаков с 0 вместо пустых данных делаю обучающую и тестовую выборки. Использую параметр стратификации (test_size=0.3,  random_state=0, stratify=y)
2. Масштабирую полученные выборки
3. Создаю объект логистической регрессии, не забывая передать параметры: solver='liblinear', class_weight='balanced', penalty='l1'
4. Подбираю параметры при помощи GridSearchCV
5. Получаю веса, нахожу нулевые индексы

Ответ не принимает система. Может быть, обучать модель нужно было на других данных? Я использовал только вещественные с нулями. Спасибо.

@Aroh подсказал решение. Моя ошибка была в том, что обучать модель нужно на смеси вещественных и категориальных признаков, а нулевые признаки искать только среди первых 13 вещественных в полученном решении. Тогда ответ принимается.
источник

A

Aroh in Machine learning
категориальные добавить не забыли?
источник

D

Dmitrii in Machine learning
намеренно не добавлял. т.е. при обучении использовать также и категориальные, а нулевые искать только среди вещественных (первые 13 из пяти с лишним тысяч признаков)?
источник

A

Aroh in Machine learning
да
источник

D

Dmitrii in Machine learning
спасибо, сейчас попробую
источник

А

Артем in Machine learning
Aroh
X_cat посмотрите, если там есть что-то отличное от 0 или 1, то у вас проблема
короче да, косяк был. onehot сработал криво и получилось не 5000 с лишним тысяч признаков а всего около 400. Исправил - ответ принят. Тем не менее странно что приняты ответы 2 и 3 построенные на этих кривых 400 признаках...
источник

D

Dmitrii in Machine learning
Aroh
категориальные добавить не забыли?
прекрасно, ответ был принят!
источник

А

Артем in Machine learning
Aroh
И метод делающий one hot разбивку их не обработал
спасибо!
источник

А

Артем in Machine learning
для себя сделал вывод, что надо сделить за размерностью матрицы признаков на каждом шаге трансформаций этих признаков
источник

A

Aroh in Machine learning
#C2W4 в задании пишут " В реальности часто применяется следующая стратегия выбора шага: как только выбран алгоритм, подберем коэффициент перед ним численным методом оптимизации таким образом, чтобы отклонение от правильных ответов было минимальным.". Вопрос: Тут предлагают перебрать коэффициент по сетке?
источник

АК

Артур Ким in Machine learning
Anton Rogozin
Анализ текстов, временные ряды, идентификация пользователей, отток клиентов. Меня пока заинтересовали анализ текста и отток пользователей, думаю за них приняться
Анализ отзывов самый простой, я делал его. Фишка в том, что ты сам должен найти и спарсить датасет. Начинал также анализ временных рядов, но там у меня пошли затыки с тем, что некоторые вещи долго вычислялись на моем компьютере, хотя он и довольно мощный.
источник

АК

Артур Ким in Machine learning
Anton Rogozin
Кто прошёл или проходит 6 курс? Какие впечатления от выбранного/выбранных проектов? Сейчас начал проходить этот курс и встал выбор, с каких проектов лучше начать)
На одном из форумов шестого курса говорится, что задачи не одинаковые по сложности, и я с этим согласен.

Также поддерживаю мнение, что выбор зависит в первую очередь от того, где дальше работать. Ну а потом уже что интересно.
источник
2020 June 02

А

Артем in Machine learning
Артур Ким
На одном из форумов шестого курса говорится, что задачи не одинаковые по сложности, и я с этим согласен.

Также поддерживаю мнение, что выбор зависит в первую очередь от того, где дальше работать. Ну а потом уже что интересно.
а где работать и что нравится в рамках данного курса вещи плохо совместимые?
источник

AR

Anton Rogozin in Machine learning
Артур Ким
Анализ отзывов самый простой, я делал его. Фишка в том, что ты сам должен найти и спарсить датасет. Начинал также анализ временных рядов, но там у меня пошли затыки с тем, что некоторые вещи долго вычислялись на моем компьютере, хотя он и довольно мощный.
Спасибо)
источник

AR

Anton Rogozin in Machine learning
Артем
а где работать и что нравится в рамках данного курса вещи плохо совместимые?
К примеру, если хочешь работать с нейронками, эта специализация не по теме) Этот курс больше по классическому ML
источник

АК

Артур Ким in Machine learning
Артем
а где работать и что нравится в рамках данного курса вещи плохо совместимые?
Нет, просто курсовые проекты очень разные, и часто бывает так, что интересно решать не только полезные на работе задачи.
источник

АК

Артур Ким in Machine learning
Anton Rogozin
Спасибо)
Всегда рад помочь!
источник

АК

Артур Ким in Machine learning
Anton Rogozin
К примеру, если хочешь работать с нейронками, эта специализация не по теме) Этот курс больше по классическому ML
Согласен, но базу дают качественную, как мне кажется.
источник

А

Артем in Machine learning
Anton Rogozin
К примеру, если хочешь работать с нейронками, эта специализация не по теме) Этот курс больше по классическому ML
интересно, кстати, где первую работу быстрее найти можно при одинаковом усердии? в нейронках или ML?
источник

AR

Anton Rogozin in Machine learning
Искать работу по зарплате или быстроте вхождения тоже важно, но не менее важен кайф от работы. Мне кажется, что с классическим ML (эта специализация) проще найти работу: либо в аналитики данных податься, либо в дата сайентисты. А вообще развивайся во всем, что приносит результат и кайф. Что тебе интереснее, тем и занимайся)
источник