Size: a a a

Яндекс.Диалоги (сообщество разработчиков)

2019 October 20

ДП

Денис Пешехонов... in Яндекс.Диалоги (сообщество разработчиков)
На текущий момент языки Алексы такие
источник

AZ

Andrew Zahalski in Яндекс.Диалоги (сообщество разработчиков)
Денис Пешехонов
Почему ничего? В 6 пункте я написал, что Алекса может переключаться между языками на лету. Понятно, что русского там нет, но я сравнивал именно протоколы и возможности для разработчиков.
ну то, что понятно тут не факт... Может появился :)
источник

ПА

Просто Алёша... in Яндекс.Диалоги (сообщество разработчиков)
Денис Пешехонов
Разобрали вдвоём с @wooferclaw протокол Алексы, сделали пару тестовых навыков.

Что хуже, чем у Алисы:
1. Нельзя прочитать всё сообщение пользователя. Разработчик должен в админ-панели сначала задать наборы ключевых слов, которые будет ловить его навык, и может читать значения только по этим ключевым словам. Навык при этом не пришлёт всю команду, а пришлёт событие в стиле "Пользователь сказал что-то, что пододшо под набор включевых фраз номер три".

2. На экране не отображается ни распознанный текст, ни полученный текст. Общение только голосом даже с телефона. Понятно, почему — флагманский продукт Амазоне это именно колонка, подозреваю тут ситуация обратная с Яндексом. Если у Яндекса 1% людей пользуется Станцией, а все остальные приложением, то у Амазона скорее всего 1% людей пользуется приложением, а остальные колонкой.

3. Нет кнопок, невозможно подсказать пользователю варианты дальнейших действий.

Что лучше, чем у Алисы:
1. Несколько разработчиков могут админить один и тот же навык.

2. Можно запускать на колонке и в приложении без какой-то предварительной модерации.

3. Если возникла ошибка, то Алекса присылает на вебхук дополнительный запрос с описанием ошибки.

4. Очень богатый набор возможностей: можно запускать музыку и использовать другие фичи платформы, то есть частично подавать из навыка команды самой Алексе.

5. Целый отдельный язык для отображения информации на дисплее для колонки подключённой к телевизору.

6. Очень богатый язык разметки TTS (у них он называется SSML — Speech Synthesis Markup Language). У пауз можно задавать длительность до 10 секунд, аудиофайлы можно подтягивать прямо из сети по адресу на mp3, можно на лету переключаться между языками и между голосами, использовать эффекты тона (например шёпот или выделение повышенным тоном), переключать фонемы.

7. Монетизация, отдельные функции и виды команд для этого.

8. Своего рода конструктор диалогов прямо в админ-панели.

9. Нет кнопок. Разработчик вынужден лучше проектировать сценарии и диалоги, а не просто копировать чатботов с других платформ.
6. У Алисы же тоже можно паузы задавать.
У Алексы тоже нет функционала пробуждения колонки из навыка?
источник

ПА

Просто Алёша... in Яндекс.Диалоги (сообщество разработчиков)
Andrew Zahalski
там при смене ака надо обновлять страницу, изменения не применяются
Понял, спс
источник

ДП

Денис Пешехонов... in Яндекс.Диалоги (сообщество разработчиков)
Просто Алёша
6. У Алисы же тоже можно паузы задавать.
У Алексы тоже нет функционала пробуждения колонки из навыка?
6. Ну, у Алисы условно, просто ставишь кучу дефисов подряд, и максимальная длительность небольшая. Разве что звук с тишиной вставлять. В любом случае, этот пункт ведь не только про одни паузы.

Нет, пробуждения не нашёл. Точно так же нужно отвечать на входящий запрос.
источник

ПА

Просто Алёша... in Яндекс.Диалоги (сообщество разработчиков)
Денис Пешехонов
6. Ну, у Алисы условно, просто ставишь кучу дефисов подряд, и максимальная длительность небольшая. Разве что звук с тишиной вставлять. В любом случае, этот пункт ведь не только про одни паузы.

Нет, пробуждения не нашёл. Точно так же нужно отвечать на входящий запрос.
Там специальная команда есть - sil <[миллисекунды]> .
источник

ДП

Денис Пешехонов... in Яндекс.Диалоги (сообщество разработчиков)
О, это новая тема, прикольно, не видел
источник

VP

Vitaliy Potapov in Яндекс.Диалоги (сообщество разработчиков)
Денис Пешехонов
О, это новая тема, прикольно, не видел
Да, это зарелизили потихому - а штука очень полезная! Вообще за обзор спасибо - интересно!! 👍👍
источник

МЗ

Михаил Захаров... in Яндекс.Диалоги (сообщество разработчиков)
Денис Пешехонов
Разобрали вдвоём с @wooferclaw протокол Алексы, сделали пару тестовых навыков.

Что хуже, чем у Алисы:
1. Нельзя прочитать всё сообщение пользователя. Разработчик должен в админ-панели сначала задать наборы ключевых слов, которые будет ловить его навык, и может читать значения только по этим ключевым словам. Навык при этом не пришлёт всю команду, а пришлёт событие в стиле "Пользователь сказал что-то, что пододшо под набор включевых фраз номер три".

2. На экране не отображается ни распознанный текст, ни полученный текст. Общение только голосом даже с телефона. Понятно, почему — флагманский продукт Амазоне это именно колонка, подозреваю тут ситуация обратная с Яндексом. Если у Яндекса 1% людей пользуется Станцией, а все остальные приложением, то у Амазона скорее всего 1% людей пользуется приложением, а остальные колонкой.

3. Нет кнопок, невозможно подсказать пользователю варианты дальнейших действий.

Что лучше, чем у Алисы:
1. Несколько разработчиков могут админить один и тот же навык.

2. Можно запускать на колонке и в приложении без какой-то предварительной модерации.

3. Если возникла ошибка, то Алекса присылает на вебхук дополнительный запрос с описанием ошибки.

4. Очень богатый набор возможностей: можно запускать музыку и использовать другие фичи платформы, то есть частично подавать из навыка команды самой Алексе.

5. Целый отдельный язык для отображения информации на дисплее для колонки подключённой к телевизору.

6. Очень богатый язык разметки TTS (у них он называется SSML — Speech Synthesis Markup Language). У пауз можно задавать длительность до 10 секунд, аудиофайлы можно подтягивать прямо из сети по адресу на mp3, можно на лету переключаться между языками и между голосами, использовать эффекты тона (например шёпот или выделение повышенным тоном), переключать фонемы.

7. Монетизация, отдельные функции и виды команд для этого.

8. Своего рода конструктор диалогов прямо в админ-панели.

9. Нет кнопок. Разработчик вынужден лучше проектировать сценарии и диалоги, а не просто копировать чатботов с других платформ.
Хуже, п1.  — это назывется Intent (я знаю, что ты знаешь это) т.е. намерение пользователя, т.е. что он хочет от голосового помощника. И я бы отнёс это в раздел "лучше". И вот в чём ключевая разница: Alexa использует ML (машинное обучение) и тебе не надо указывать все возможные фразы юзера, чтобы определить его намерение — обычно достаточно до десятка устойчивых выражений. Алиса же  даёт тебе "сырую" фразу юзера и массив слов из неё — а ты сам в коде определяй его намерения — и без всяких там излишеств типа ML. Разница — как между автоматом  и мушкетом — хотя оба стреляют.
источник

ДП

Денис Пешехонов... in Яндекс.Диалоги (сообщество разработчиков)
Михаил Захаров
Хуже, п1.  — это назывется Intent (я знаю, что ты знаешь это) т.е. намерение пользователя, т.е. что он хочет от голосового помощника. И я бы отнёс это в раздел "лучше". И вот в чём ключевая разница: Alexa использует ML (машинное обучение) и тебе не надо указывать все возможные фразы юзера, чтобы определить его намерение — обычно достаточно до десятка устойчивых выражений. Алиса же  даёт тебе "сырую" фразу юзера и массив слов из неё — а ты сам в коде определяй его намерения — и без всяких там излишеств типа ML. Разница — как между автоматом  и мушкетом — хотя оба стреляют.
Но на этом движке очень сложно сделать навык типа как Мой Секретарь, у которого значительно более сложный анализ входящей фразы
источник

МЗ

Михаил Захаров... in Яндекс.Диалоги (сообщество разработчиков)
Денис Пешехонов
Но на этом движке очень сложно сделать навык типа как Мой Секретарь, у которого значительно более сложный анализ входящей фразы
Наоборот — твоя задача в алексе лишь сделать хорошие интенты — т.е. на все возможные случаи использования твоего секретаря.
источник

ДП

Денис Пешехонов... in Яндекс.Диалоги (сообщество разработчиков)
Случаев миллион )
источник

ДП

Денис Пешехонов... in Яндекс.Диалоги (сообщество разработчиков)
По сути мне на интентах придётся повторить свой движок определения дат
источник

ДП

Денис Пешехонов... in Яндекс.Диалоги (сообщество разработчиков)
это нереально
источник

МЗ

Михаил Захаров... in Яндекс.Диалоги (сообщество разработчиков)
Денис Пешехонов
Случаев миллион )
ну это так кажется — ты же не обрабатывал в алисе миллион вариантов. что касается дат — там есть т.н. системные слоты. Тут дело скорее в привычке — привык к Алисе — кажется, что так и должно быть. Хотя Алиса — явно сестрёнка Алексы (значительно младшая). А вот когда посмотришь, например,на Bixby ваще обалдеешь (вангую) 😊
источник

ДП

Денис Пешехонов... in Яндекс.Диалоги (сообщество разработчиков)
Михаил Захаров
ну это так кажется — ты же не обрабатывал в алисе миллион вариантов. что касается дат — там есть т.н. системные слоты. Тут дело скорее в привычке — привык к Алисе — кажется, что так и должно быть. Хотя Алиса — явно сестрёнка Алексы (значительно младшая). А вот когда посмотришь, например,на Bixby ваще обалдеешь (вангую) 😊
Слоты работают как nlu.entities в Алисе. Ну так они не всё ловят. Если какой-то слот не поймает какой-то вариант фразы, то уже не сработает.
источник

МЗ

Михаил Захаров... in Яндекс.Диалоги (сообщество разработчиков)
Денис Пешехонов
Слоты работают как nlu.entities в Алисе. Ну так они не всё ловят. Если какой-то слот не поймает какой-то вариант фразы, то уже не сработает.
в алисе маловато — например нет явно нужного телефона (приём заказов например)
источник

МЗ

Михаил Захаров... in Яндекс.Диалоги (сообщество разработчиков)
Денис Пешехонов
Слоты работают как nlu.entities в Алисе. Ну так они не всё ловят. Если какой-то слот не поймает какой-то вариант фразы, то уже не сработает.
И сыровато: например видит (FIO) Иванов, но не видит Иванова 😊 Проверь если не веришь
источник

ДП

Денис Пешехонов... in Яндекс.Диалоги (сообщество разработчиков)
Михаил Захаров
И сыровато: например видит (FIO) Иванов, но не видит Иванова 😊 Проверь если не веришь
Я знаю, я с именами в Алисе тоже много работал
источник

AZ

Al Zatv in Яндекс.Диалоги (сообщество разработчиков)
Михаил Захаров
Хуже, п1.  — это назывется Intent (я знаю, что ты знаешь это) т.е. намерение пользователя, т.е. что он хочет от голосового помощника. И я бы отнёс это в раздел "лучше". И вот в чём ключевая разница: Alexa использует ML (машинное обучение) и тебе не надо указывать все возможные фразы юзера, чтобы определить его намерение — обычно достаточно до десятка устойчивых выражений. Алиса же  даёт тебе "сырую" фразу юзера и массив слов из неё — а ты сам в коде определяй его намерения — и без всяких там излишеств типа ML. Разница — как между автоматом  и мушкетом — хотя оба стреляют.
Скорее, в алексе это сделано для защиты секурности. Имхо.
источник