Всем привет! Хочу попросить совета. Работаю в команде, занимающейся роботом-оператором, который общается с клиентами по заранее сформированным сценариям. Сценарий в данном случае - это набор состояний робота, между которыми он переключается в зависимости от ответов человека.
Сейчас есть идея автоматизировать процесс создания такого сценария под новые продукты. Самый желаемый итог, чтобы, получив от заказчика транскрипции диалогов живого оператора с клиентом, на выходе формировалось что-то похожее на сценарий. То есть, как понимаю, мне нужно выделять основные вопросы и обращения оператора и далее анализировать различные варианты того, как человек отвечает.
Из исходных данных есть около 1000 диалогов, отдельно реплики оператора, отдельно - клиента. Есть временные отметки каждой репилики, то есть можно восстановить порядок разговора. Буду признателен за подсказку любых пайплайнов/решений/библиотек/видео/статей, которые помогли бы мне выделять структуру в таких диалогах. Пока дальше отдельной кластеризации реплик оператора и реплик клиента не ушел.