Las funciones de reconocimiento de voz se están convirtiendo en una de las grandes bazas de los fabricantes de tecnología, tanto para animar los dispositivos móviles como para facilitar la navegación a través de los clásicos ordenadores de escritorio.
¿Cómo se ha conseguido duplicar el rendimiento? Aplicando el concepto de redes neuronales dinámicas (DNN por sus siglas en inglés) al reconocimiento de voz.
Según explica la compañía de Redmond y recoge VentureBeat, este enfoque imita a la forma en la que funciona el cerebro humano detectando “pequeñas variaciones en el habla que permanecen iguales incluso cuando cambia la voz”. Esto es, que las perturbaciones se estabilizan aunque alguien comience a hablar a toda velocidad o muy alto, module el timbre de su voz o se entrecorte.
Otra ventaja es que con este cambio se ha reducido la tasa de error desde el 16% anterior a un más interesante 13,5%, también cuando hay ruido de fondo.
Los usuarios podrán realizar y recibir llamadas de Teams en teléfonos de escritorio de la…
Kyndryl y Microsoft presentan Dragon Copilot, un asistente de IA generativa que automatiza la documentación…
VEDA es un Servicio de Vigilancia Externa y Defensa ante Amenazas, mientras que SAVIA ofrece…
Un informe de UST revela que el 18 % de las empresas destinará más del…
El gigante de los seminconductores buscaba nuevo director ejecutivo tras la marcha de Pat Gelsinger…
Cortés mantiene sus funciones como director de Ventas y Socios, mientras que Portilla seguirá siendo…