Cómo funciona la tecnología para hablar a las computadoras [Infografía]

Cómo funciona la tecnología para hablar a las computadoras [Infografía]

¿Quién no ha soñado com poseer las herramientas necesarias para poder controlar mediante la voz el auto, las luces de la casa, la lavadora, la estufa, el portón del garage? Yo he soñado muchas veces eso y no me imagino un futuro sin todas estas características. Gracias a gran medida a los avences de la ciencia y a la imaginación del ser humano representada en las películas de ciencia ficción podemos darnos una idea de como sería un posible futuro con respecto a la tecnología, un ejemplo muy claro es la película Minority Report dirigida por Steven Spielberg y protagonizada por Tom Cruise en donde podemos ver controles táctiles para prácticamente cualquier objeto, reconocimiento de retina y muchas aplicaciones más. Ahora bien, con respecto a los controles de voz, es decir, cuando nosotros damos una orden a la computadora o algún dispositivo hablando para que realice una acción no están tan lejos de convertirse en una realidad, de hecho, ya contamos con muchos dispositivos que llevan esta tecnología, la cual es llamada Automatic Speech Recognition o por sus siglas ASR, un ejemplo de ello son los actuales comandos de voz que utilizan los celulares o inclusive el buscador de Google. ¿Cómo funciona esta tecnología? Gracias a la infografía realizada por Medical Transcription podemos saberlo.

Cómo funciona la tecnología para hablar a las computadoras [Infografía] - sistema-automatico-de-reconocimiento-de-voz

El objetivo del ASR es solo uno, poder convertir la voz en texto para que de esa forma el dispositivo sea capaz de entender el comando oral y ejecutarlo. Para esto se tiene que haber adiestrado al software a ciertas palabras concretas como: Llamar, colgar, buscar contacto, números en general etc. El principal problema de esta tecnología es que su funcionamiento varía según el lenguaje que se hable, debido a que cada lengua tiene un fonemas diferentes, tan solo el Inglés tiene alrededor de 40 fonemas diferentes y es por ello también que en muchas ocasiones se mal entiende una acción.

Este es un ejemplo de la información que podemos encontrar en la siguiente infografía:

Cómo funciona la tecnología para hablar a las computadoras [Infografía] - como-funciona-sistema-automaico-de-reconocimiento-de-voz