Las investigaciones que está acometiendo Microsoft en temas de reconocimiento del habla, o reconocimiento de voz, están dando sus frutos.
Según ha anunciado la compañía de Redmond, su equipo ha conseguido reducir la tasa de error de palabras (conocida por las siglas WER) a mínimos históricos. En una evaluación de benchmark realizada con el estándar Switchboard, ha bajado dicha tasa al 6,3 %. Hasta ahora la mejor marca de IBM, que también trabaja en estas cuestiones, ha sido del 6,6 %.
“Este nuevo hito se ha beneficiado de una amplia gama de nuevas tecnologías desarrolladas en la comunidad de Inteligencia Artificial por parte de muchas organizaciones diferentes durante los últimos 20 años”, indica Xuedong Huang, jefe científico para temas de voz de Microsoft. Hace justo dos décadas la tasa WER más favorable era de más del 43 %.
Gracias a este logro, Microsoft espera poder avanzar en la creación de experiencias personales con tecnologías como Cortana o Skype Translator. Entre sus objetivos, tal y como explican sus responsables, están crear sistemas de Inteligencia Artificial capaces de anticiparse a las peticiones de los usuarios y que, además de oír, hablen, vean y, sobre todo, entiendan.
Bajar la tasa de error de palabras da esperanzas para conseguir máquinas que comprendan el habla de la gente tan bien como los propios humanos.
Ofrece hasta 1 millón de dólares de compensación económica en caso de incidente, con la…
Este cambio refleja los avances que se producen a nivel de infraestructura TI y el…
El evento espera reunir a 17.000 directivos, que podrán escuchar a medio centenar expertos en…
Como resultado de esta operación, ampliará sus servicios en el "bronze layer" del ciclo de…
Durante el segundo trimestre de su año fiscal 2025 acumuló 1.660 millones de dólares, la…
También incluye un SDK open source para potencia el desarrollo de aplicaciones y agentes, especialmente…