прикручиваешь еще одну модель const speakerModel = new vosk.SpeakerModel(SPEAKER_MODEL_PATH); потом добавляешь сюда const rec = new vosk.Recognizer({ model: model, speakerModel: speakerModel, sampleRate: sampleRate }); ну и в результате появляется в json еще массивчик - spk. Вот это и оно.