mini chatcomment
Говорите
b
Преимущества и недостатки голосовых интерфейсов

Преимущества и недостатки голосовых интерфейсов

Краткий пересказ мыслей, изложенных Константином Самойловым, специалистом по речевым интерфейсам в Google

Доклад был изложен в июле текущего года, когда голосовой помощник «Алиса» еще не был представлен публике. Прежде всего, стоит уточнить, чем именно является голосовой интерфейс (а заодно уточнить, чем он не является).

  • Во-первых, ГИ должен уметь распознавать голоса, с учетом интонаций, акцента и некоторых дефектов речи, а также генерировать ответы, складывая слова в соответствии с правилами языка.
  • Во-вторых, ГИ должен быть обучен распознаванию естественной речи: задавая кому-то вопрос, мы не придерживаемся определенной формулировки, мы просто задаем вопрос.
  • В-третьих, система должна обладать достаточным словарным запасом и исчерпывающим пониманием грамматических конструкций, чтобы быть полезной для самых разных задач, отдаваемых разными пользователями.

Преимущества такой сложной и разветвленной системы, как голосовой интерфейс порой с трудом отличимы от недостатков, так как они часто являются всего лишь двумя сторонами одной медали. Например, чтобы завести будильник, достаточно просто отдать соответствующую команду – это просто. Но до сих пор многие люди не пользуются такого рода функциями, потому что банально не доверяют системе, которую не контролируют самолично.

К вопросу о доверии присоединяется и вопрос о безопасности. ГИ достигли такого уровня, что могут контролировать запирание двери (если входя в состав системы «Умный дом»). Устанавливая будильник, мы на самом деле готовы к тому, что есть малая вероятность того, что он не прозвонит. Но запирая входную дверь, мы не готовы рисковать. Именно поэтому в вопросах, требующих повышенного контроля система обычно снабжается дополнительными опциями, дающими пользователю больше уверенности.

Чтобы ГИ в полной мере реализовывал свой потенциал, общение с ним должно быть столь же естественным, как и обычное человеческое общение. Однако что делает общение естественным? Эксперты до сих пор затрудняются дать ответ. Именно поэтому существующие ныне системы можно назвать не окончательным, а скорее промежуточным вариантом, совершенство которого еще не достигнуто.

Исходя из всего вышесказанного, можно сделать вывод, что на данным момент ГИ наиболее полезен всего в двух случаях: 1) когда человек находится в режиме многозадачности и ему легче продиктовать что-то, что внезапно пришло на ум, чем ждать удобного момента, чтобы записать; 2) когда выполняются действия, которые не являются основной задачей. Однако не стоит думать, что возможности ГИ ограничиваются будильниками и планированием задач: интерфейсы уже интегрированы во многие «серьезные» отрасли, например, в хирургию, где врач постоянно находится в режиме многозадачности и колоссальной ответственности.

Выбрать и купить ноутбук Выбрать и купить смартфон
Ремейк Black Mirror: небезызвестный и атмосферный готический хоррор
Хотите всегда быть в курсе полезных
новостей нашего сайта?
Подпишись на наши уведомления
Подписаться
Добавить к сравнению
Добавить в «Желания»