Вот полное объяснение для понимания системы голосового помощника Siri и Cortana.

Технология голосового помощника в смартфонах, или, как они ее называют на iPhone, Siri или Cortana, конечно, большинство из нас слышали об этой технологии, и эта технология, должно быть, впечатлила вас и показывает другое измерение технологии, которая достигла этого. Это имеет большое влияние на вашу жизнь, но вы знаете, что за технологией голосового помощника, будь то Siri или Cortana, стоит большая и сложная работа, которая заслуживает признательности и потребует от нас большого количества сообщений, чтобы подробно рассказать о ней. специалисты, они сначала это понимают .. Теперь сосредоточьтесь на мне.

Чтобы упростить задачу, мы возьмем в качестве примера функцию Siri на iPhone. Когда вы разговариваете с Siri, ваш голос и разговор немедленно кодируются в виде компактной цифровой формы, которая сохраняет эту информацию внутри, превращая ваш голос в цифровая информация с 0 и 1.

Этот цифровой сигнал в вашем сетевом устройстве передается по беспроводной сети через ближайшую вышку сотовой связи, проходя через серию наземных линий к вашему интернет-провайдеру (ISP), а оттуда на сервер в облаке.

Этот цифровой сигнал содержит ряд моделей, предназначенных для понимания словаря того языка, на котором вы говорите, и одновременно ваша речь разделяется на вашем устройстве.

На вашем телефоне есть распознаватель, который подключается к облаку и распознает, можно ли обработать и выполнить команду, которую вы ввели своим голосом, на самом телефоне или ее необходимо подключить к сети.

Это похоже на то, как если бы вы попросили его воспроизвести песню на вашем телефоне, эту задачу он легко выполнит на вашем телефоне. Если Local Recognizer знает, что проблема находится внутри вашего устройства и нет необходимости использовать облако, он предупреждает Дело в том, что на этот раз он не нужен и не подключается к нему.

Когда ваш голос поступает на сервер, он сравнивает ваш голос в статистической системе, задача которой состоит в том, чтобы оценить ваш голос и определить словарный запас, который дал ваш голос, команды, которые вы сделали, и буквы, из которых состоят эти звуки.

В то же время Local Recognizer сравнивает одни и те же голоса в сокращенной версии этой статистической системы, чтобы облегчить процесс и сэкономить время. Для обеих систем самая высокая вероятность того, что система из них работает, и проходит.

Ваш разговор теперь воспринимается как последовательность гласных и согласных, которые передаются языковому исследователю и анализатору, который оценивает произнесенные вами слова.

Затем система генерирует избранный список переводов для вашей беседы, которые могут означать вашу последовательность слов.

В случае, если есть достаточная уверенность в этом результате, выданном системой, система определяет точную задачу, которую она должна выполнить. Затем вы пишете сообщение, которое хотите отправить, и, как по волшебству, вы обнаруживаете, что ваше сообщение появляется на экран без какой-либо руки, которая вам нужна, или каких-либо дополнительных усилий, кроме вашего голоса, и если во время этой задачи есть какой-либо нечеткий момент, устройство вернется к вам в этот момент и спросит вас, например, `` Вы имели в виду Ахмеда Хусейна или Ахмед Хасан ?!

Я не хотел продлевать и не хотел вдаваться в подробности или усложнять для вас вопрос, но я просто хотел донести до вас общую идею, так что я надеюсь, что вы уже прибыли.

Перейти к верхней кнопке