Una empresa española facilita el uso del ordenador a través de la voz
La solución Interlocutor Virtual integra un sintetizador de voz y una figura animada 3D capaz de reproducir oralmente un texto escrito y de gesticular en correspondencia.
La empresa compostelana Soluciones Informáticas y Multimedia está diseñando un sistema para facilitar el uso del ordenador a través de la voz y revolucionar la manera de las personas de interactuar con la computadora.
Según José Manuel Soto Vázquez, ingeniero superior de telecomunicaciones y director general de la empresa, “las últimas estadísticas revelan que el 80 por ciento de la población tiene serias dificultades para manejar el ratón y el teclado”.
Así, el “Interlocutor Virtual” pretende sustituir estas interfaces por una comunicación inteligente y sencilla con el ordenador a través de la voz. La investigación cuenta con el apoyo de la Dirección de I+D de la Consellería de Innovación.
El trabajo que está desarrollando la empresa trata de integrar productos de software ya existentes en el mercado como son un sintetizador de voz y un avatar (figura animada 3D) capaz de reproducir oralmente un texto escrito y de gesticular en correspondencia.
Soto Vázquez indica al respecto que el sintetizador de voz recibirá las órdenes que le transmita el usuario y hará una asociación con las alternativas que guarda el interlocutor virtual como entradas factibles. El último paso consistirá en enlazar esas entradas con la respuesta adecuada.
Lo que verá el usuario al acercarse al ordenador es una figura femenina animada en 3D que tiene la función de reconocer expresiones verbales elementales dichas por una persona, dentro de un universo limitado de elementos entre los que estarán objetos de colores, y con la capacidad también para responder con una explicación oral acompañada por las gesticulaciones correspondientes de su cara.
En la actualidad, la compañía realiza la segunda fase del proyecto, que consiste en la integración y en la programación de sistemas con el diseño de un avatar en 3D animado que integra un módulo de reconocimiento de voz y de aplicación del habla (gesticulación).