Size: a a a

Machine learning

2020 June 04

AR

Anton Rogozin in Machine learning
Ruslan Sabirov
LDA, но он не очень новый
bigartm как раз и содержит lda)
источник

RS

Ruslan Sabirov in Machine learning
Anton Rogozin
bigartm как раз и содержит lda)
Аа, не знал. Спасибо!
источник

L

Lieutenant Dan in Machine learning
Артём Глазунов
клянусь, вчера у меня ни в какую не хотело работать, сейчас проверил, все в порядке. Магия.
источник

АГ

Артём Глазунов... in Machine learning
Anton Rogozin
Что-то сразу в голову не пришло. Если выборка с текстами не размечена, то кроме bigartm, можно использовать TfidfVectorizer с любым методом кластеризации данных. И визуализировать с помощью t-sne, чтобы понять, хорошо ли кластеризовалось
Ну или countvectorizer... В курсе рассматривалась задача, где простой kmeans даёт приемлемое качество на текстах, при этом агломеративная кластеризация не справлялась... Только эксперименты, при этом не лишним будет посмотреть на коэф силуэта и визуализацию правила локтя от yellowbrick.cluster для kmeans, чтобы посмотреть метрики все же при задании количества кластеров(тем)...
источник

АГ

Артём Глазунов... in Machine learning
Lieutenant Dan
клянусь, вчера у меня ни в какую не хотело работать, сейчас проверил, все в порядке. Магия.
Там ещё squeeze () есть для удаления лишних размерностей, вроде, если проблема в них
источник

L

Lieutenant Dan in Machine learning
спасибо за помощь, учту на будущее
источник

АГ

Артём Глазунов... in Machine learning
Anton Rogozin
bigartm как раз и содержит lda)
Там вроде ещё в gensim есть реализация lda
источник

АГ

Артём Глазунов... in Machine learning
Динара
а зачем создавать нулевой массив? разве нельзя создать пустой а затем в него добавлять?
Хорошая практика работы с такими массивами, скорость выше, когда задача помасштабнее. Сначала выделяем память, а потом в неё помещаем данные. Все же list это не совсем массив, строго говоря,  список всё же, отсюда и ограничения... Плюс просто удобней задать сразу и заполнять одним действием, чем аппендить списки потом, на мой взгляд
источник

Д

Динара in Machine learning
все понятно спасибо вам
источник

K

K-S in Machine learning
Там о другом вопрос был) но за лишнее упоминание Демешева плюс
источник

Е

Егор in Machine learning
Добрый день. Нашёл ошибку. 1 месяц 4-ая неделя. Первый тест:
"Так, плазму четвёртой группы можно переливать всем, а плазму первой — только носителям первой группы."
Вообще-то наоборот. И из таблицы это следует.
Первую группу можно переливать всем (их даже называли раньше универсальными донорами), а четвёртая группу можно только в четвёртую. Четвёртую называют универсальный реципиент, т.к. в неё можно любую перелить.
источник

ЯШ

Ярик Шаталов... in Machine learning
Но на решение задачи это никак не влияет при этом
источник

Е

Егор in Machine learning
Ярик Шаталов
Но на решение задачи это никак не влияет при этом
Да, но может запутать.
источник

ЯШ

Ярик Шаталов... in Machine learning
Может, только если ты знаешь, как это работает на самом деле 😄
источник

Е

Егор in Machine learning
какое-то отношение к здравоохранению имею поэтому и передёрнуло слегка )))
источник

P

Pavel in Machine learning
Юрий Шахов
да, похоже на тот, что нужно.

Посмотрите, пожалуйста, также и stochastic_variables.ipynb - с ним на курсере та же проблема. это файл с этой же недели из раздела про вероятность и случайные величины.
ещё актуально?
источник

ЮШ

Юрий Шахов in Machine learning
Pavel
ещё актуально?
Нет, спасибо. Все подошло.
источник

ФЗ

Флорид Зарипов... in Machine learning
Всем привет!

Кто как запускает модели на gpu?
Поделитесь хорошей рабочей связкой

я пробовал варианты:

host Win10 + Anaconda (jupyter + tensorflow), все драйверы nvidia.
Заработало, но jupyter виснет на датасетах,
и команды из google colab типо wget не работают приходится вручную скачивать прикручивать, неудобно.

Вариант: host Win10 2004 + оболочка linux (wsl2) ubuntu + docker (образ tensorflow jupyter gpu), взлетел, но gpu оказывается не поддерживается.
Глянул вариант c инсайдерской сборкой Windows 10 Fast Preview, обещают реализовать поддержку gpu в ближайшие месяцы. мимо.

Сейчас пробую вариант: гипервизор VMWare (virtualbox пишут такое себе для gpu, хз) + VM Ubuntu Server + Docker. заработало.
с хостового браузера вошел в jupyter, но использование gpu как-то не чувствую, видимо нужно копаться в настройках дальше.
источник

λ

λ in Machine learning
привт. Подскажите пожалуйста, как распознать числа , но не фото, а с скриншота например имени файла
источник

K

KALEBORACIY 🐧 in Machine learning
Подскажите классные книги по DS
источник