Телеграмм чат группы bigdata_ru страница 1979

parrot.ru

Рейтинг популярных групп и каналов

В рейтинге участвует:

групп:

каналов:

Виртуальный сервер на SSD - недорого!

Аренда выделенных и виртуальных серверов (VDS/VPS), хостинг, аренда IP-адресов, администрирование, круглосуточная поддержка

qwarta.ru подробнее

Резервное копирование с проверкой на вирусы!!!

Удобный сервис создания резервных копий на любой сервер сети интернет. Отслеживайте изменения, проверяйте на вирусы. Надежно защитите свой бизнес!

go.backupland.com

Выбираете сервер? Любая конфигурация на заказ!

Аренда физических серверов любых конфигураций под любые запросы - 1С бухгалтерия, игровые сервера, нагруженные проекты, интернет-магазины!

qwarta.ru подробнее

Size: a a a

AI / Big Data / Machine Learning

4195 membersпожаловаться на группу

2020 April 24

IL

Ivan Landgraf in AI / Big Data / Machine Learning

Друзья, не совсем по теме. В институте нам дали задание по мл. Develop a machine learning model for explicit content detection on a web page. Кому интересно помочь мне в этом (не за бесплатно) пишите в лс. Задание достаточно интересное (классифицировать что порно-запрос, а что нет😁) проходит в форме соревнования на лучшую модель в каггле. Все критерии (кому инетересно) расскажу в лс.

источник

10:55пожаловаться #1

AF

Adam Fox in AI / Big Data / Machine Learning

Всем привет, может кто посоветовать обзор ML-подходов в задачах типа SLAM, MVG, 6DoF pose estimation?

источник

14:42пожаловаться #2

2020 April 25

U

Ugly in AI / Big Data / Machine Learning

/report

источник

19:26пожаловаться #3

U

Ugly in AI / Big Data / Machine Learning

или как тут репортить

источник

19:26пожаловаться #4

D•

Dan • Captain in AI / Big Data / Machine Learning

Все правильно, так и надо :)

источник

19:27пожаловаться #5

Z

ZveroBoy in AI / Big Data / Machine Learning

теперь интересно что там было

источник

19:28пожаловаться #6

D•

Dan • Captain in AI / Big Data / Machine Learning

теперь интересно что там было

Взлом вк за деньги :)

источник

19:28пожаловаться #7

Z

ZveroBoy in AI / Big Data / Machine Learning

лол

источник

19:31пожаловаться #8

D•

Dan • Captain in AI / Big Data / Machine Learning

Нет, просто так не надо :)

источник

19:33пожаловаться #9

2020 April 26

АК

Андрей Копылов in AI / Big Data / Machine Learning

Ребят, подскажите. LSTM можно же обучить на небольшом наборе данных, а потом модель загружать и дообучать такими же небольшими наборами данных? Никаких подводных камней нет?

источник

18:42пожаловаться #10

АК

Андрей Копылов in AI / Big Data / Machine Learning

Иными словами не будет ли отличаться результат работы, если дообучать частями от того, если сразу на всём наборе обучить?

источник

18:45пожаловаться #11

I

Ilya in AI / Big Data / Machine Learning

Вопрос на счет feature selection, теоретически нам рассказывали, что если есть фичеры, у которых корреляция высокая, например я взял 0.93, то можно один из них убрать.

С другой стороны, чисто для проверки, я проверил какая точность при использование только одного, потом двух, трех и четырех фичеров, которые ранее в процессе показали такую корреляцию.

Более чем это, я сделал Exhaustive Feature Selector на эти четыре фичера (и только на них, из изначально где то сорока), и по обоим экспериментам получил, что все же выбор нескольких только из них дает лучшие результаты, чем оставить только один из этого сета коррелирующих.

Чем это объясняется ? Тем что я оставил только 4 фичера из всех, и возможно при таком малом количестве информации, любая дополнительная информация повышает точность предсказания ?

Или все же лучше не искать вручную такие высоко-коррелирующие фичеры и дать самим алгоритмам выбирать самые лучшие фичеры ?

источник

18:49пожаловаться #12

u

undiabler in AI / Big Data / Machine Learning

Если это не производные друг от друга фичи, а разные по существу просто коррелирующие друг с другом - лучше оставлять данные.
Большое количество коррелирующих фич просто приведет вас к быстрому оверфит результату. Если такого не происходит и вы успешно боретесь с оверфитом то ничего страшного в большом количестве фич нету.

источник

18:57пожаловаться #13

I

Ilya in AI / Big Data / Machine Learning

Если это не производные друг от друга фичи, а разные по существу просто коррелирующие друг с другом - лучше оставлять данные.
Большое количество коррелирующих фич просто приведет вас к быстрому оверфит результату. Если такого не происходит и вы успешно боретесь с оверфитом то ничего страшного в большом количестве фич нету.

а оверфит смотрится по проверки точности по тесту ?
То есть если норм результат, то оверфита нет ?

Кстати, в целом, точность с убиранием и без убирания получилась одинаковая.

Просто этот эксперимент с локальным сетом высоко коррелирующих фичеров заставил задуматься.

источник

19:02пожаловаться #14

I

Ilya in AI / Big Data / Machine Learning

и вытекающий вопрос исходя из этого, убирать ли вообще вручную такие высоко коррелирующие, или дать алгоритмам полностью контроль ?
То есть если там KNN и деревья сочтут их полезными, даже если я вручную видел, что они высоко коррелирующие, то оставлять

источник

19:07пожаловаться #15

u

undiabler in AI / Big Data / Machine Learning

а оверфит смотрится по проверки точности по тесту ?
То есть если норм результат, то оверфита нет ?

Кстати, в целом, точность с убиранием и без убирания получилась одинаковая.

Просто этот эксперимент с локальным сетом высоко коррелирующих фичеров заставил задуматься.

Да, все верно. Если на валидации точность/лосс ведет себя таким же образом как и на тренеровочном датасете тогда все ок. Если быстро начинает расползаться в разные стороны тогда все плохо и надо дальше работать с подготовкой базы.

источник

19:07пожаловаться #16

u

undiabler in AI / Big Data / Machine Learning

Мой опыт - не убирать все что может быть полезным.
Убирать только в случае если у вас какая-то сложная архитектура самой сети и нужно сократить данные, или если есть проблемы с обучением. Только тогда пересмотр фичей и выборка что подрезать.
Для knn, svm, деревьев как раз проще оценить влияние фичи.
В случае если у вас какой-нибудь cnn или lstm модель оценить влияние отдельных фич достаточно сложно и оценка делается общего результата модели, а лишние данные обычно не убираются.

источник

19:15пожаловаться #17

I

Ilya in AI / Big Data / Machine Learning

понял, спасибо, наверное так и сделаю, максимум в отчете опишу, что есть такие то и такие то связи, и такая то точность если без таких то и таких то фичов.

источник

19:17пожаловаться #18

EZ

Evgeniy Zheltonozhskiy🇮🇱 in AI / Big Data / Machine Learning

Андрей Копылов

Иными словами не будет ли отличаться результат работы, если дообучать частями от того, если сразу на всём наборе обучить?

Будет офк

источник

21:06пожаловаться #19

АК

Андрей Копылов in AI / Big Data / Machine Learning

Evgeniy Zheltonozhskiy🇮🇱

Будет офк

Спасибо

источник

21:12пожаловаться #20