Aquí está la explicación completa para entender el sistema de asistente de voz de Siri y Cortana

La tecnología de asistente de voz en los smartphones, o como le llaman en el iPhone, Siri o Cortana, por supuesto, la mayoría de nosotros hemos oído hablar de esta tecnología, y esta tecnología te debe haber impresionado y te muestra otra dimensión de la tecnología que ha llegado hasta ella. Tiene un gran impacto en tu vida, pero sabes que detrás de la tecnología de asistente de voz, ya sea Siri o Cortana, hay un gran y complejo trabajo que merece reconocimiento y necesitará muchas publicaciones nuestras para elaborarlo. especialistas, primero lo entienden.. y ahora se enfocan conmigo.

Para hacerlo más fácil, tomaremos como ejemplo la función de Siri en el iPhone, cuando hablas con Siri, tu voz y tu conversación se codifican inmediatamente en forma de un formulario digital compacto, que conserva esta información en su interior, transformando tu voz. en información digital con 0 y 1.

Esta señal digital en su dispositivo en red se transmite de forma inalámbrica a través de su torre celular más cercana, pasa a través de una serie de líneas fijas a su proveedor de servicios de Internet (ISP) y de allí a un servidor en la nube.

Esta señal digital está cargada con una serie de modelos que se dedican a comprender el vocabulario del idioma que hablabas y simultáneamente se divide tu discurso en tu dispositivo.

Hay un Reconocedor en su teléfono que se conecta a la nube y reconoce si el comando que ingresó con su voz se puede manejar y ejecutar en el teléfono o si necesita estar conectado a la red.

Esto es exactamente como si le pidieras que reprodujera una canción en tu teléfono, esta tarea la puede realizar fácilmente en tu teléfono. Si The Local Recognizer sabe que el asunto está dentro de tu dispositivo y no hay necesidad de usar la nube, alerta que no lo necesita esta vez y no se conecta a él.

Cuando tu voz llega al servidor, este compara tu voz dentro de un sistema estadístico cuya tarea es estimar tu voz e identificar el vocabulario que dio tu voz, los comandos que hiciste y las letras que componen estos sonidos.

Al mismo tiempo, The Local Recognizer compara los mismos votos en una versión condensada de este sistema estadístico para facilitar el proceso y ganar tiempo.Para ambos sistemas, la mayor probabilidad de un sistema de ellos es trabajar desde y pasar.

Tu conversación ahora se entiende como una serie de vocales y consonantes que se pasan a un explorador y analizador de idiomas que estima las palabras que dijiste.

Luego, el sistema genera una lista seleccionada de traducciones para su conversación que podría significar su secuencia de palabras.

En el caso de que exista suficiente confianza en este resultado que ha obtenido el sistema, el sistema determina la tarea exacta que debe realizar, y si su intención, por ejemplo, es enviar un mensaje de texto a Ahmed Hussein, por ejemplo, el El dispositivo preparará el nombre "Ahmed Hussein" de la lista de nombres privados. Luego escribes el mensaje que deseas enviar y, como por arte de magia, encuentras que tu mensaje aparece en la pantalla sin ninguna mano que necesites o ningún esfuerzo adicional. excepto su voz, y si hay algún punto vago durante esta tarea, el dispositivo regresará a usted en ese punto y le preguntará, por ejemplo, ¿Quiso decir Ahmed Hussein o Ahmed Hassan?

No quise extenderme y no quise entrar en muchos detalles o complicarte el asunto, pero quise llegarte la idea general simplemente, así que espero que ya hayas llegado.

Ir al botón superior