Categories: InnovaciónInvestigación y Desarrollo

Microsoft duplica la velocidad de su tecnología de reconocimiento de voz

Las funciones de reconocimiento de voz se están convirtiendo en una de las grandes bazas de los fabricantes de tecnología, tanto para animar los dispositivos móviles como para facilitar la navegación a través de los clásicos ordenadores de escritorio.

Y ahora los usuarios de productos de Microsoft podrán hacerlo todavía más rápido, gracias a un avance que permite reproducir los comandos hablados a texto escrito en tan sólo 0,53 segundos frente a los 1,06 segundos que se tardaba hasta el momento.

¿Cómo se ha conseguido duplicar el rendimiento? Aplicando el concepto de redes neuronales dinámicas (DNN por sus siglas en inglés) al reconocimiento de voz.

Según explica la compañía de Redmond y recoge VentureBeat, este enfoque imita a la forma en la que funciona el cerebro humano detectando “pequeñas variaciones en el habla que permanecen iguales incluso cuando cambia la voz”. Esto es, que las perturbaciones se estabilizan aunque alguien comience a hablar a toda velocidad o muy alto, module el timbre de su voz o se entrecorte.

Otra ventaja es que con este cambio se ha reducido la tasa de error desde el 16% anterior a un más interesante 13,5%, también cuando hay ruido de fondo.

Lea también : El 68% de los trabajadores en España ya usa IA para mejorar su productividad

Mónica Tilves

Licenciada en Xornalismo por la Universidad de Santiago de Compostela en la especialidad de Periodismo Electrónico y Multimedia. Apasionada de los gadgets, la fotografía digital, el diseño web y el arte. Tras un primer contacto con el mundo de la prensa escrita y con la suficiencia investigadora debajo del brazo, me decanto por los medios online. Cubro la actualidad informativa en Silicon Week desde 2011, además de colaborar en otras publicaciones del grupo NetMediaEurope en España como Silicon News. Ahora en Silicon.es.