Size: a a a

Machine learning

2020 June 04

АГ

Артём Глазунов... in Machine learning
Хотя я, повторюсь, использовал обычный рэндом оверсэмплер
источник

АГ

Артём Глазунов... in Machine learning
Так же, замечу, что оверсэмплинг при рэндом нужно добавлять в пайплайн, иначе кросс-валидация будет завышаться
источник

АГ

Артём Глазунов... in Machine learning
Попробуйте ещё веса объектам добавлять, это в параметрах классификатора уже
источник

A

Aroh in Machine learning
Tommy Cash
Коллеги, привет!
Вопрос по #С2W3
Все категориальные признаки в X преобразуйте в строки, пропущенные значения требуется также преобразовать в какие-либо строки, которые не являются категориями (например, 'NA'),....
а затем
Для использования модели регрессии требуется преобразовать категориальные признаки в вещественные
*Для чего мы сначала преобразовывали все признаки в строки? Энкодер не работает с другими типами?*
Да
источник

АГ

Артём Глазунов... in Machine learning
Артём Глазунов
15 место получил
Не, это я по английским отзывам 15 место тогда получил, по русским соревнование закрыто уже было( но 94 процента моя точность по русским в соревновании была на паблик и 92 на прайвэт части теста, особо не усложнял подход
источник

ЮШ

Юрий Шахов in Machine learning
#C1W4 Всем добрый день.  У кого-нибудь есть сохранившиеся копии файлов ноутбука - материалов для самостоятельного изучения из блока про статистику? На курсере какой-то глюк - не дает их скачать. Написал обращение, но ответа пока нет. Заранее спасибо.
источник

AY

Alexander Yamoldin in Machine learning
Юрий Шахов
#C1W4 Всем добрый день.  У кого-нибудь есть сохранившиеся копии файлов ноутбука - материалов для самостоятельного изучения из блока про статистику? На курсере какой-то глюк - не дает их скачать. Написал обращение, но ответа пока нет. Заранее спасибо.
источник

IN

Ivan Nazhestkin in Machine learning
Артём Глазунов
Попробуйте ещё веса объектам добавлять, это в параметрах классификатора уже
Спасибо огромное за советы:)
Попробую сейчас
источник

ЮШ

Юрий Шахов in Machine learning
К сожалению ноутбуковских файлов нет
источник

d

dK in Machine learning
Юрий Шахов
#C1W4 Всем добрый день.  У кого-нибудь есть сохранившиеся копии файлов ноутбука - материалов для самостоятельного изучения из блока про статистику? На курсере какой-то глюк - не дает их скачать. Написал обращение, но ответа пока нет. Заранее спасибо.
Этот файл интересует: https://cloud.mail.ru/public/4cLh/4EKfRbgqS ?
источник

ЮШ

Юрий Шахов in Machine learning
да, похоже на тот, что нужно.

Посмотрите, пожалуйста, также и stochastic_variables.ipynb - с ним на курсере та же проблема. это файл с этой же недели из раздела про вероятность и случайные величины.
источник

d

dK in Machine learning
Юрий Шахов
да, похоже на тот, что нужно.

Посмотрите, пожалуйста, также и stochastic_variables.ipynb - с ним на курсере та же проблема. это файл с этой же недели из раздела про вероятность и случайные величины.
источник

ЮШ

Юрий Шахов in Machine learning
Спасибо.
источник

Д

Динара in Machine learning
Добрый вечер! застряла на задании 5 2 недели. Создайте матрицу размера n * d, где n — число предложений. Заполните ее: элемент с индексом (i, j) в этой матрице должен быть равен количеству вхождений j-го слова в i-е предложение. У вас должна получиться матрица размера 22 * 254. Подскажите как можно записать кол-во вхождений, даже не представляю с чего начать. Вроде создала пустой массив, затем туда с пом.двух циклов просто добавляю слова из строк. Но у меня ничего не выходит.
источник

a

apex in Machine learning
Динара
Добрый вечер! застряла на задании 5 2 недели. Создайте матрицу размера n * d, где n — число предложений. Заполните ее: элемент с индексом (i, j) в этой матрице должен быть равен количеству вхождений j-го слова в i-е предложение. У вас должна получиться матрица размера 22 * 254. Подскажите как можно записать кол-во вхождений, даже не представляю с чего начать. Вроде создала пустой массив, затем туда с пом.двух циклов просто добавляю слова из строк. Но у меня ничего не выходит.
На stepik есть курс типа факультатива к этому курсу. Там все эти простые задачки учат решать.
источник

Д

Динара in Machine learning
а как назыв.курс сам можете сказать?
источник

a

apex in Machine learning
Практикум по математике и python
источник

АГ

Артём Глазунов... in Machine learning
Динара
Добрый вечер! застряла на задании 5 2 недели. Создайте матрицу размера n * d, где n — число предложений. Заполните ее: элемент с индексом (i, j) в этой матрице должен быть равен количеству вхождений j-го слова в i-е предложение. У вас должна получиться матрица размера 22 * 254. Подскажите как можно записать кол-во вхождений, даже не представляю с чего начать. Вроде создала пустой массив, затем туда с пом.двух циклов просто добавляю слова из строк. Но у меня ничего не выходит.
Здесь нужен массив нулей np. zeros(), а предложения превратить в массивы с помощью split(). Количество вхождений слова в массив count(). Также понадобится словарь dict, куда слова будут записываться в ключи для удобства поиска потом. Вроде d это размерность этого словаря, а точнее массива уникальных ключей словаря .keys() . Весь процесс представляет собой превращение предложений в векторы(строки с частотами) , чтобы находить расстояния между ними.
источник

TU

Tatiana Uaman in Machine learning
#C3W2 Задание на РСА.  Правильно ли я понимаю, что просто PCA и есть RandomizedPCA в последних версиях библиотеки sklearn?
источник

AZ

Andrey Zhuravlev in Machine learning
Динара
Добрый вечер! застряла на задании 5 2 недели. Создайте матрицу размера n * d, где n — число предложений. Заполните ее: элемент с индексом (i, j) в этой матрице должен быть равен количеству вхождений j-го слова в i-е предложение. У вас должна получиться матрица размера 22 * 254. Подскажите как можно записать кол-во вхождений, даже не представляю с чего начать. Вроде создала пустой массив, затем туда с пом.двух циклов просто добавляю слова из строк. Но у меня ничего не выходит.
Строки нужно обработать предварительно. Посмотрите работу со словарями в питоне
источник