Las investigaciones que está acometiendo Microsoft en temas de reconocimiento del habla, o reconocimiento de voz, están dando sus frutos.
Según ha anunciado la compañía de Redmond, su equipo ha conseguido reducir la tasa de error de palabras (conocida por las siglas WER) a mínimos históricos. En una evaluación de benchmark realizada con el estándar Switchboard, ha bajado dicha tasa al 6,3 %. Hasta ahora la mejor marca de IBM, que también trabaja en estas cuestiones, ha sido del 6,6 %.
“Este nuevo hito se ha beneficiado de una amplia gama de nuevas tecnologías desarrolladas en la comunidad de Inteligencia Artificial por parte de muchas organizaciones diferentes durante los últimos 20 años”, indica Xuedong Huang, jefe científico para temas de voz de Microsoft. Hace justo dos décadas la tasa WER más favorable era de más del 43 %.
Gracias a este logro, Microsoft espera poder avanzar en la creación de experiencias personales con tecnologías como Cortana o Skype Translator. Entre sus objetivos, tal y como explican sus responsables, están crear sistemas de Inteligencia Artificial capaces de anticiparse a las peticiones de los usuarios y que, además de oír, hablen, vean y, sobre todo, entiendan.
Bajar la tasa de error de palabras da esperanzas para conseguir máquinas que comprendan el habla de la gente tan bien como los propios humanos.
En 2024 registró una mejoría del 11 % que le ha reportado un total de…
Permite visualizar el uso de la plataforma de Google por usuario y proyecto para identificar…
La pregunta que hoy se hacen las empresas es cómo escalar sus iniciativas de IA…
Microsoft nació con el sueño de poner un ordenador en cada casa. Con ese objetivo…
Despliega una amplio abanico de innovaciones relacionadas con esta tecnología con motivo de la celebración…
WatchGuard Technologies observa que "los atacantes continúan explotando vulnerabilidades básicas y errores fáciles de aprovechar,…