Categories: Open SourceSoftware

Mozilla lanza un gran repositorio de voz de dominio público

Mozilla ha estado recabando muestras de voz a través de su proyecto Common Voice. Y, ahora, ha decidido lanzar la primera versión de una gran colección de voces que se caracteriza por ser de dominio público.

De hecho, sus responsables dicen que “ya es el segundo mayor conjunto de datos de voz disponible para el público que conocemos”. Y a esto habría que añadir que “personas de todo el mundo están añadiendo y validando nuevas muestras todo el tiempo”. Aunque de momento las muestras que se ofrecen están en inglés, Mozilla asegura que pronto se seguirá con “todos los idiomas”.

El repositorio actual cuenta con unas 400.000 grabaciones que pertenecen a 20.000 personas distintas. En total serían 500 horas de discurso.

El objetivo de Mozilla con Common Voice es ayudar a desarrolladores, fabricantes, empresas e investigadores a la hora de trabajar con tecnología habilitada por voz.

“La mayoría de nosotros solamente tenemos acceso a una colección bastante limitada de datos de voz”, explican desde Mozilla, añadiendo que esto es “un componente esencial para crear motores de reconocimiento de voz de alta calidad”. Además, “estos datos de voz pueden costar más de decenas de miles de dólares y su escala es insuficiente para crear un reconocimiento de voz a un nivel que espera la gente”.

“Al proporcionar este nuevo conjunto de datos públicos”, concluye Mozilla, “queremos ayudar a superar estas barreras y facilitar la creación de nuevos y mejores sistemas de reconocimiento de voz”. Entre ellos, su propio Deep Speech.

Mónica Tilves

Licenciada en Xornalismo por la Universidad de Santiago de Compostela en la especialidad de Periodismo Electrónico y Multimedia. Apasionada de los gadgets, la fotografía digital, el diseño web y el arte. Tras un primer contacto con el mundo de la prensa escrita y con la suficiencia investigadora debajo del brazo, me decanto por los medios online. Cubro la actualidad informativa en Silicon Week desde 2011, además de colaborar en otras publicaciones del grupo NetMediaEurope en España como Silicon News. Ahora en Silicon.es.

Recent Posts

¿Cuáles son los retos de la Smart City?

El desarrollo de la Smart City en España es crucial, ya que 4 de cada…

1 hora ago

Tecnología y estrategias para la nueva era de amenazas

La ciberseguridad es un desafío cada vez mayor con el usuario como punto más débil,…

2 horas ago

SIA crea una Cátedra de Ciberinteligencia junto con la Universidad de Málaga

Girará en torno a tres temáticas: desinformación, contrainteligencia y credenciales expuestas.

15 horas ago

La optimización de productos digitales gana a la creación entre las prioridades empresariales

El 57 % de las compañías españolas está manteniendo este año su nivel de inversión…

17 horas ago

En España, el 22 % de las empresas industriales sufre problemas de red 2 o 3 veces al mes

Entre los problemas a los que se enfrentan las compañías con infraestructura distribuida geográficamente se…

18 horas ago

Así evolucionará la mensajería empresarial RCS durante los próximos años

Juniper Research prevé un incremento del 50 % en el tráfico de mensajes para 2025.

19 horas ago