Size: a a a

AI / Big Data / Machine Learning

2020 January 22

R

Roman in AI / Big Data / Machine Learning
Это че?
источник

Ю

Юра Незнанов in AI / Big Data / Machine Learning
Disentangled representation - это представление данных в виде независимых факторов. То есть изменение одного фактора в самих данных, например, цвета объекта, ведёт к изменению одного фактора в представлении, к изменению, например, одного измерения.
источник

Ю

Юра Незнанов in AI / Big Data / Machine Learning
источник

R

Roman in AI / Big Data / Machine Learning
Ну хз. Первая проблема это что считать независимыми факторами, т.е. есть предположение о распределении еще до начала расчетов. Что уже плохо, добавляет ошибку
источник

R

Roman in AI / Big Data / Machine Learning
.полезны могут быть например для интерпретируемости модели
источник

Ю

Юра Незнанов in AI / Big Data / Machine Learning
Это мне такую тему диплома дипломник предложил))) который сам не знает что это
источник

R

Roman in AI / Big Data / Machine Learning
Я могу придумать миллионы микрофакторов, естественно не полностью независимых, потом придеться применить какой то метод снижения размеронсти, так нафига когда можно сразу эмбеддинги считать?
источник

R

Roman in AI / Big Data / Machine Learning
Юра Незнанов
Это мне такую тему диплома дипломник предложил))) который сам не знает что это
Не слушай его;) лушче брать какую то тему на острие. Посмотри свежак с хорошей цитироемостю на arxiv
источник

Ю

Юра Незнанов in AI / Big Data / Machine Learning
Roman
Не слушай его;) лушче брать какую то тему на острие. Посмотри свежак с хорошей цитироемостю на arxiv
Окей. Ахах. Кста на кегле ща совернования от фейсбука - нужно определить видео реальное или на нем сгенерен фейковый чел и говорит фейковую инфу. Там награда 500к баксов)))) зачем диплом когда можно заниматься этим ахах
источник

R

Roman in AI / Big Data / Machine Learning
Юра Незнанов
Окей. Ахах. Кста на кегле ща совернования от фейсбука - нужно определить видео реальное или на нем сгенерен фейковый чел и говорит фейковую инфу. Там награда 500к баксов)))) зачем диплом когда можно заниматься этим ахах
Ну есть еще щас в рф соревнование nlp тематике , поиск фактических и логических ошибок в научных текстах, там 100 лямов рублей призовой.
источник

R

Roman in AI / Big Data / Machine Learning
Можно конечно и результаты моделировния на соревновании в курсовую превратить
источник

R

Roman in AI / Big Data / Machine Learning
А вот тебе тема - графовые модели , используют в задачах где нужно анализировать социальные графы, орг. структуру или цепочки поведения типа продажи, поведение пользователя на сайте и т.п.
источник

Ю

Юра Незнанов in AI / Big Data / Machine Learning
Roman
А вот тебе тема - графовые модели , используют в задачах где нужно анализировать социальные графы, орг. структуру или цепочки поведения типа продажи, поведение пользователя на сайте и т.п.
... звучит интересно
источник

y

your-mirror in AI / Big Data / Machine Learning
Roman
А вот тебе тема - графовые модели , используют в задачах где нужно анализировать социальные графы, орг. структуру или цепочки поведения типа продажи, поведение пользователя на сайте и т.п.
Интересно
источник

GD

Gimm Degreeze in AI / Big Data / Machine Learning
😂
источник

A

Andrey in AI / Big Data / Machine Learning
Andrey
кстати, я всё хочу у вас спросить, вы для ETL и Data Warehouse для того, чтобы подготовить данные к нужному вам формату, сами пишете код или используете готовые решения?
я к чему спрашивал про ETL в контексте ML..

почти каждая вакансия здесь предполагает написание кастомных пайплайнов для того, чтобы адаптировать данные к процессам компании. и процессы могут быть повязаны как на открытые решения, так на внутренние продукты компаний.. и в свете этого меня не покидает мысль о том, что эту проблему (написания кода там, где он может быть не нужен) можно решить! весь процесс поставки любых данных для аналитики может быть описан декларативно. т.е. иными словами, любые данные можно привести к каким угодно форматам, минимизируя код вплоть до нуля.

т.е. вместо кодирования пайплайнов можно их составлять через определенный интерфейс в браузере.

например, тут упомянут был не так давно pandas с поддержкой CSV.GZ. и у каждого тула есть свои интерфейсы. и к ним можно приводить данные без кода.

скажите, вам это было бы интересно?

беглый поиск по чату показывал, что интерес был..
источник

D🐈

Dan 🐈 Capybara in AI / Big Data / Machine Learning
Roman
Не удалось посмотреть. Запись вебинара существует?
запись урока от 20 числа: https://otus.pw/IHx6/
источник

i

ikasymov in AI / Big Data / Machine Learning
Привет ребят, где можно прочитать про выбросы?
Побровал через Normal Distribution and S.D не подходит для моих данных.
На какие ссылки можете тыкнуть? Желательно где используют питоновские либы. Данные у меня ввиде массива цифр.
источник

R

Roman in AI / Big Data / Machine Learning
ikasymov
Привет ребят, где можно прочитать про выбросы?
Побровал через Normal Distribution and S.D не подходит для моих данных.
На какие ссылки можете тыкнуть? Желательно где используют питоновские либы. Данные у меня ввиде массива цифр.
Pyod
источник

V

Violet in AI / Big Data / Machine Learning
Юра Незнанов
Окей. Ахах. Кста на кегле ща совернования от фейсбука - нужно определить видео реальное или на нем сгенерен фейковый чел и говорит фейковую инфу. Там награда 500к баксов)))) зачем диплом когда можно заниматься этим ахах
А условия какие?
источник