Привет. Есть следующая задача: в аудиозаписи есть несколько голосов, надо выделить каждый отдельно, в текст либо аудио. Какие есть готовые решения для такого либо, что можно почитать, чтобы разобраться?
Такая штука может подойти, интересно? Вообще, гугли в сторону waveNet, как-то так