Size: a a a

AI / Big Data / Machine Learning

2020 March 15

DB

Dmitry Belkevich in AI / Big Data / Machine Learning
Maxim Filippov
На что вообще влияет количество каналов (слоёв) в свёртке? К примеру у нас фильтр 5x5x3 в 20 каналов, правильно ли я понимаю, что каждый канал будет отличаться от другого?
фильтры-свертки глянь что такое, станет понятнее. разница нейросетевых фильтров и 'стандартных' - что числа для ядер (кернелов) сеть подбирает сама во время обучения. изначально они случайные. вот у тебя получится 20 разных ядер для слоя. можно сказать что 20 нейронов
5x5x3 - каждое ядро фильтра размером 5х5 точек и на 3 по цветам (rgb) то есть 75 чисел на каждый канал
источник

WI

Walking In the Darkness in AI / Big Data / Machine Learning
А этот электронный менеджер-продаж как себя ведёт? Он вообще живой будет или просто тупо будет себя вести как робот? Ему же ещё надо будет вести веб-аналитику и мониторить ресурсы для рекламы.
источник

ПП

Проксимов Прксимович in AI / Big Data / Machine Learning
Dan 🐈 Capybara
Забавно получилось с рекламой после твоего сообщения 😂
А вообще ничего сложного нет, есть nlp, куча готовых библиотек и датасетов с русским языком
Эх, помню пару лет назад слезно умоляли дать русский датасет
источник

OS

Oleg Serikov in AI / Big Data / Machine Learning
У меня есть несколько десятков аудио, на которых разговаривают люди.
Большинство говорящих всегда из одной и той же маленькой группы, никто никого не перебивает — короче достаточно чистые разговоры.

Есть ли какое-то решение, которое бы позволило легко подсветить, какой из людей из этой группы когда говорит, а когда говорит кто-то незнакомый, а когда никто не говорит?
источник

OS

Oleg Serikov in AI / Big Data / Machine Learning
А если нет, то куда гуглить — наверняка что-то можно дообучить такой задаче, я плохо знаю как сейчас устроено распознавание речи.
источник

FC

Father Carlo in AI / Big Data / Machine Learning
Oleg Serikov
А если нет, то куда гуглить — наверняка что-то можно дообучить такой задаче, я плохо знаю как сейчас устроено распознавание речи.
«В круге первом»
источник

OS

Oleg Serikov in AI / Big Data / Machine Learning
Father Carlo
«В круге первом»
погуглил, нашол солженицина. это вы шутите про большого брата?)

у меня не подслушанные телефонные разговоры, а данные, которые люди сами записали но сейчас размечают руками. ну и качество офигенное, а не телефонное.
источник

СМ

Стас М in AI / Big Data / Machine Learning
степфордские жоны
источник

FC

Father Carlo in AI / Big Data / Machine Learning
Oleg Serikov
погуглил, нашол солженицина. это вы шутите про большого брата?)

у меня не подслушанные телефонные разговоры, а данные, которые люди сами записали но сейчас размечают руками. ну и качество офигенное, а не телефонное.
Да, по теме, к сожалению не очень шутка конечно. Но описание как раз отличается ровно на шаг в технологиях - и качество, и запись...

А по теме - не подскажу. Увы.
источник

MT

Michael Tkach in AI / Big Data / Machine Learning
Oleg Serikov
У меня есть несколько десятков аудио, на которых разговаривают люди.
Большинство говорящих всегда из одной и той же маленькой группы, никто никого не перебивает — короче достаточно чистые разговоры.

Есть ли какое-то решение, которое бы позволило легко подсветить, какой из людей из этой группы когда говорит, а когда говорит кто-то незнакомый, а когда никто не говорит?
Глянь Voicemap на гитхабе, либо просто статьи на тему speaker identification / speaker recognition (их хватает в гугле)
источник

M

Magic in AI / Big Data / Machine Learning
Oleg Serikov
У меня есть несколько десятков аудио, на которых разговаривают люди.
Большинство говорящих всегда из одной и той же маленькой группы, никто никого не перебивает — короче достаточно чистые разговоры.

Есть ли какое-то решение, которое бы позволило легко подсветить, какой из людей из этой группы когда говорит, а когда говорит кто-то незнакомый, а когда никто не говорит?
Такое ощущение будто этот же вопрос был год назад
источник
2020 March 16

M

Magic in AI / Big Data / Machine Learning
Говорят главная проблема это нехватка данных

У меня вот к примеру несколько десятков тысяч часов войсов есть, а что с ними делать хз
источник

OS

Oleg Serikov in AI / Big Data / Machine Learning
Magic
Такое ощущение будто этот же вопрос был год назад
о а не помните когда от кого как звучал? ну чтобы найти тут)
источник

TN

Timofey Naumenko in AI / Big Data / Machine Learning
Oleg Serikov
У меня есть несколько десятков аудио, на которых разговаривают люди.
Большинство говорящих всегда из одной и той же маленькой группы, никто никого не перебивает — короче достаточно чистые разговоры.

Есть ли какое-то решение, которое бы позволило легко подсветить, какой из людей из этой группы когда говорит, а когда говорит кто-то незнакомый, а когда никто не говорит?
Предобучить на voxceleb2 с triplet loss / arcface, потом прогнать через ваши данные, и сравнивать эмбеддинги
источник

MF

Maxim Filippov in AI / Big Data / Machine Learning
Dmitry Belkevich
фильтры-свертки глянь что такое, станет понятнее. разница нейросетевых фильтров и 'стандартных' - что числа для ядер (кернелов) сеть подбирает сама во время обучения. изначально они случайные. вот у тебя получится 20 разных ядер для слоя. можно сказать что 20 нейронов
5x5x3 - каждое ядро фильтра размером 5х5 точек и на 3 по цветам (rgb) то есть 75 чисел на каждый канал
Т.е. чем больше 'нейронов' в данном случае, тем лучше модель ищет фичи и тем самым выше риск переобучения?
источник

MF

Maxim Filippov in AI / Big Data / Machine Learning
То есть CNN как бы на 20 фильтрах лучше видит ключевые сходства(фичи) изображений, чем на 4-х?
источник

DB

Dmitry Belkevich in AI / Big Data / Machine Learning
Maxim Filippov
Т.е. чем больше 'нейронов' в данном случае, тем лучше модель ищет фичи и тем самым выше риск переобучения?
думаю да. судя по тому, что каналов на слой никогда не делают много но и не один
источник

D🐈

Dan 🐈 Capybara in AI / Big Data / Machine Learning
Как научить нейросеть узнавать объекты с первого раза?

Зарегистрируйтесь среди первых на бесплатный вечерний вебинар 17 марта «Triplet loss: учим нейросеть узнавать объекты с первого раза»: https://otus.pw/bzFj/

На вебинаре:
− научитесь работать с tensorflow datasets
− рассмотрите проблему one-shot learning, metric learning
− разберете, что такое siamese networks и triplet loss
− обучите нейросеть, способную с первого раза узнавать объекты.

Проведет онлайн-практику Михаил Степанов, программист в отделе машинного обучения компании Jet Infosystems и преподаватель онлайн-курса по компьютерному зрению в Отус Онлайн-образование
источник

ПП

Проксимов Прксимович in AI / Big Data / Machine Learning
источник

D🐈

Dan 🐈 Capybara in AI / Big Data / Machine Learning
Огонь :) самое время углубить знания
источник