13 de agosto de 2012

El computador le obedece a la voz y hasta transcribe lo que se le dicta


Con sólo decir "Abrir Word" el procesador de texto se despliega en pantalla. Luego, el usuario dicta una extensa carta, hablando tal como lo hace en una conversación cotidiana. En la pantalla las palabras comienzan a aparecer como por arte de magia, sin siquiera tocar el teclado.
Es la ventaja de las aplicaciones "voice to text" o "speech recognition" que permiten controlar los computadores con comandos hablados. Si bien existen hace más de una década, ahora hay un renacimiento debido a la irrupción de los smartphones, que convirtieron en algo cotidiano "hablarle a la máquina".

Wilson Pais, director de Innovación y Nuevas Tecnologías de Microsoft, dice que los algoritmos que permiten reconocer los comandos de voz se han perfeccionado con los años, pero lo que transformó definitivamente el escenario es la irrupción de procesadores más poderosos, que permiten hacer el reconocimiento más rápido y con mayor precisión.
El nuevo Windows 8 permitirá el dictado, pero también realizar acciones a través de los comandos de voz, incluso ellos se podrán personalizar para crear órdenes verbales para las cosas que el usuario realiza en forma habitual.
Pais cuenta que el reconocimiento de voz también se ha incorporado a la consola Xbox 360, ya que Kinect incluye un micrófono de precisión que aísla la voz. "Esto permite manejar la interfaz de usuario o jugar algunos títulos usando órdenes verbales".
Aprende del usuario
Apple también las ha sumado a sus dispositivos. Su nuevo sistema operativo, Mountain Lion, sigue con la tradición de los comandos de voz, pero ahora incluye "Dictation", para poder decirle al computador todo lo que antes había que tipear. Actualmente no está disponible en español (está en inglés, alemán, entre otros idiomas), pero en Apple dicen que lo estará antes de fin de año.
Una solución más avanzada es Dragon NaturallySpeaking, programa que ya va en su versión 12.
El software aprende del usuario y permite incorporar modismos como "cachái". Funciona en español y reconoce bien el acento chileno, aunque en las configuraciones sólo aparece el "español mexicano", dice Juan Carlos Rodríguez, representante de Nuance en Chile, la empresa que lo desarrolla.
Tiene un modo que permite el dictado y otro para darle órdenes al computador. Además, viene configurado para usarlo en Excel (y pasar de una celda a otra con una orden verbal) o para redactar correos con los servicios gratuitos más usados, como Gmail o Hotmail.
La última versión permite usar un teléfono inteligente como micrófono, si es que el computador no tiene uno, o bien para dictar a distancia, por ejemplo, recostado en un sillón. También permite "descasetear" conversaciones grabadas, aunque los resultados no son tan buenos como cuando se dicta.
Dragon se puede descargar (por US$ 100) o comprar en tiendas de tecnología, donde se incluyen micrófonos. Está disponible para Mac y PC.
Fuente: La Tercera

No hay comentarios: