Espressif развивается семимильными шагами.
https://www.youtube.com/watch?v=pJhPCW2apDQНо китайцы опять недоговаривают. Voice Recognition в S3 ограничивается только сценарием с wake-word.
То есть, распознать силами SoC получится только слово для пробуждения ассистента. А вот потом уже он передаст записанную фразу в облако и там будет распознаваться остальная часть фразы.
Но зачем упоминать об этом в видео, правда?
Учитывая стоимость и сравнительно годное состояние SDK, скоро рынок наводнят "умные колонки" с встроенными Алисами, Салютами, а может даже и начнется лютейшая конкуренция на рынке голосовых помощников между гигантами и молодыми стартапами.
Задачкой для Wi-FI будет передать записанную фразу быстро и без задержек, а потом так же молниеносно скачать ответ.
Уже не получится хуяк-хук и в продакшен. Придется подумать о том как работают сетевые очереди, буферы, и как заставить всё это работать с минимальной задержкой.