Size: a a a

Machine learning

2020 December 03

MN

Maxim Neronov in Machine learning
источник

SS

Sergey Salnikov in Machine learning
inf - это число, над ним можно провдить какие-то операции, над nan - нет. смысл в том, что после длинных цепочек операций над числами и inf получится осмысленное значение числа или inf, а если участвует nan, то получится nan, которые распространится дальше по цепочке вычислений. inf может быть вполне себе ожидаемый результат, а nan - это где-то ошибка
источник

SS

Sergey Salnikov in Machine learning
nan нужен для индикации ошибки
источник

MN

Maxim Neronov in Machine learning
Насколько я понял из документа, это некоторый объект, который призван отражать неопределённый результат, произошедший в ходе выполнения некоторых операций над числами. В частности np.inf/np.inf даёт np.nan как раз из этого стандарта
источник

SS

Sergey Salnikov in Machine learning
да, это вообще даже не из python, а из стандарта float
источник

🐙

🐙 in Machine learning
Привет! Подскажите по заданию #C4W4 биоинформатика, как понять следующее выражение:

Применить критерий для каждого гена нужно будет дважды:
- для групп normal (control) и early neoplasia (treatment)
- для групп early neoplasia (control) и cancer (treatment)

У нас метки только normal, neoplasia и cancer, ни о каких control и treatment речи не идёт. По смыслу под control я бы понимал группу, принимающую placebo, а под treatment - лекарство, но тут кажется нужно просто три группы попарно сравнить 🤔

Ок, думаю, treatment и control - просто метки того, в каком порядке массивы подавать в функцию fold_change
источник

MM

Mira Mironova in Machine learning
Всем привет!!

Может вам будет интересно:
источник

MM

Mira Mironova in Machine learning
Учись ML у лучших

Science club от MIL Team приглашает студентов поработать над задачами машинного обучения с топовыми научными руководителями. Выбери себе ментора и подай заявку https://bit.ly/3qrzuRq:

Science Club - это объединение студентов, которые стремятся к научной карьере и опытных менторов-исследователей в области Data Science. Вместе они проводят исследования, пишут статьи и выступают на конференциях.

Приглашаем студентов поработать над задачами машинного обучения с топовыми научными руководителями. Выбери себе ментора и подай заявку:

Михаил Бурцев

Руководитель DeepPavlov.ai и заведующий Лаборатории нейронных систем и глубокого обучения МФТИ.

Интересы: нейросетевые модели обучения, нейрокогнитивные и

нейрогибридные системы, эволюция адаптивных систем и эволюционные алгоритмы

Примеры задач

- Язык клеток. Применение моделей, разработанных для работы с текстами, для понимания языка генов. Обучение и анализ генных моделей из семейства трансформер для восстановления генных сетей клеток мозга.
- Целенаправленный диалог. Разработка и имплементация алгоритмов управления разговорными навыками с учетом целей пользователя в диалоге. Анализ структуры диалога, предсказание переходов между под-диалогами.
- Тематический диалог. Разработка системы для автоматической генерации тематического разговорного навыка на основе неразмеченных диалоговых данных.

Юрий Куратов

Исследователь Лаборатории нейронных систем и глубокого обучения МФТИ.

Интересы: языковые модели, разрешения кореференции, BERT, ответно - вопросные модели для SQuAD.

Задачи

- Языковые модели. Модификации архитектуры трансформер для улучшения качества языковых моделей. Добавление памяти, альтернативные гипотезы, триплетное кодирование, иерархические архитектуры.
- Быстрые языковые модели, дистилляция. Обучение языковых моделей меньшего размера с дистилляцией знаний из больших предобученных моделей.
- Парафразы. Переписывание реплики чат-бота с сохранением содержания. Цель - переписывать шаблонные реплики для большего разнообразия, в том числе более разговорного звучания фраз.

Алексей Гончаров

Руководитель MIL Team

Интересы: signal processing, semi-supervised, expert systems, time series clustering

Задача

- Semi-supervised постановка. Классификация и кластеризация набора временных рядов. Частичная разметка данных для обучения и оценки качества формируется экспертом из предметной области задачи. В ходе исследования встретим много вызовов:
- Какую именно разметку может сделать эксперт, чтобы увеличить качество решения итоговой задачи;
- Как именно подавать данные на разметку эксперту, чтобы кривая качества обучения от числа размеченных данных была наиболее крутой;
- Как правильно производить оценку качества решения исходной задачи и обучение моделей при наличии небольшой размеченной выборки;

Решение поставленной задачи будет протестировано на прикладной области: психотипирование человека на основе данных об использовании мышки и тачпада в интернет-ресурсах.

По всем вопросам обращаться: @tapridchenko
источник

i

igor in Machine learning
Sergey Salnikov
да, 1 + np.inf == 2 + np.inf, но inf - это число (пусть из проекционнки), с inf можно что-то осмысленное делать, а nan - это "не число", над ним осмысленные арифметические операции не определены.
Нет это не число
источник

SS

Sergey Salnikov in Machine learning
в проективной геометрии бесконечность - это число, над inf можно выполнять осмысленные операции, например 1 / inf = 0.
источник

AP

Alexander Petrenko in Machine learning
Mira Mironova
Учись ML у лучших

Science club от MIL Team приглашает студентов поработать над задачами машинного обучения с топовыми научными руководителями. Выбери себе ментора и подай заявку https://bit.ly/3qrzuRq:

Science Club - это объединение студентов, которые стремятся к научной карьере и опытных менторов-исследователей в области Data Science. Вместе они проводят исследования, пишут статьи и выступают на конференциях.

Приглашаем студентов поработать над задачами машинного обучения с топовыми научными руководителями. Выбери себе ментора и подай заявку:

Михаил Бурцев

Руководитель DeepPavlov.ai и заведующий Лаборатории нейронных систем и глубокого обучения МФТИ.

Интересы: нейросетевые модели обучения, нейрокогнитивные и

нейрогибридные системы, эволюция адаптивных систем и эволюционные алгоритмы

Примеры задач

- Язык клеток. Применение моделей, разработанных для работы с текстами, для понимания языка генов. Обучение и анализ генных моделей из семейства трансформер для восстановления генных сетей клеток мозга.
- Целенаправленный диалог. Разработка и имплементация алгоритмов управления разговорными навыками с учетом целей пользователя в диалоге. Анализ структуры диалога, предсказание переходов между под-диалогами.
- Тематический диалог. Разработка системы для автоматической генерации тематического разговорного навыка на основе неразмеченных диалоговых данных.

Юрий Куратов

Исследователь Лаборатории нейронных систем и глубокого обучения МФТИ.

Интересы: языковые модели, разрешения кореференции, BERT, ответно - вопросные модели для SQuAD.

Задачи

- Языковые модели. Модификации архитектуры трансформер для улучшения качества языковых моделей. Добавление памяти, альтернативные гипотезы, триплетное кодирование, иерархические архитектуры.
- Быстрые языковые модели, дистилляция. Обучение языковых моделей меньшего размера с дистилляцией знаний из больших предобученных моделей.
- Парафразы. Переписывание реплики чат-бота с сохранением содержания. Цель - переписывать шаблонные реплики для большего разнообразия, в том числе более разговорного звучания фраз.

Алексей Гончаров

Руководитель MIL Team

Интересы: signal processing, semi-supervised, expert systems, time series clustering

Задача

- Semi-supervised постановка. Классификация и кластеризация набора временных рядов. Частичная разметка данных для обучения и оценки качества формируется экспертом из предметной области задачи. В ходе исследования встретим много вызовов:
- Какую именно разметку может сделать эксперт, чтобы увеличить качество решения итоговой задачи;
- Как именно подавать данные на разметку эксперту, чтобы кривая качества обучения от числа размеченных данных была наиболее крутой;
- Как правильно производить оценку качества решения исходной задачи и обучение моделей при наличии небольшой размеченной выборки;

Решение поставленной задачи будет протестировано на прикладной области: психотипирование человека на основе данных об использовании мышки и тачпада в интернет-ресурсах.

По всем вопросам обращаться: @tapridchenko
👍 отличный проект
Спасибо за инфу
источник

SS

Sergey Salnikov in Machine learning
"На разрабатываемые решения необходимо будет писать документацию по ГОСТ для закрытия этапов проекта." ох и за...тесь вы писать документацию по ГОСТу )
источник

AP

Alexander Petrenko in Machine learning
Sergey Salnikov
"На разрабатываемые решения необходимо будет писать документацию по ГОСТ для закрытия этапов проекта." ох и за...тесь вы писать документацию по ГОСТу )
похоже, что мимо чатом :)
источник

SS

Sergey Salnikov in Machine learning
это с сайта MIL, который выше, они набирают junior на half-time
источник

AP

Alexander Petrenko in Machine learning
Sergey Salnikov
это с сайта MIL, который выше, они набирают junior на half-time
не смотрел еще так внимательно, но ГОСТ это перебор конечно :)
источник

SS

Sergey Salnikov in Machine learning
я просто когда-то делал задачу по госту, это трэш. нужно расписать каждый шаг. с точки зрения отчетности - удобно, но для разработчика - кошмар
источник

SK

Sergey Kozlov in Machine learning
20 тыр по госту... перспективно! 😂
источник

SS

Sergey Salnikov in Machine learning
вот список гостов на разработку: https://gost2014.ru/D/Gost_dokumentatsii-na-razrabotku-programmnogo-obespecheniya/
источник

i

igor in Machine learning
Sergey Salnikov
в проективной геометрии бесконечность - это число, над inf можно выполнять осмысленные операции, например 1 / inf = 0.
Нет такого числа в алгебре чисел
источник

SS

Sergey Salnikov in Machine learning
я знаю что такое поле вещественных чисел, но вычисления на компьютере - это не чистая, а прикладная математика, тут надо применить математику для конкретных потребностей вычисления, и inf (вместе с nan) - одна из них
источник