Categories: CloudSaaS

Google actualiza la API de Cloud Speech

La API de Google Cloud Speech, que desde su lanzamiento en 2016 ha permitido a los desarrolladores utilizar los servicios de Google para transcribir palabras habladas a texto ha recibido hoy una importante actualización.

La novedad más interesante de la API es la adición de soporte para 30 nuevos idiomas, que se suman a los 89 lenguajes que ya entendía el servicio, incluyendo múltiples variantes regionales del inglés, español y árabe. En la lista de estos nuevos idiomas encontramos el bengalí, letón y suahili. Según Google, los nuevos lenguajes incorporados a la API de Cloud Speech son hablados por alrededor de 1.000 millones de personas.

Además, Google también ha introducido algunas características principales nuevas. Entre ellos está el soporte a las marcas de tiempo a nivel de palabra, informa TechCrunch. La idea es etiquetar cada palabra con su marca de tiempo para que los desarrolladores puedan, por ejemplo, permitir fácilmente a sus usuarios oír como sonaba una palabra dada.

Esto es especialmente interesante para los servicios de transcripción y traducción supervisados por humanos que utilizan esta API para acelerar sus flujos de trabajo. “Tener la habilidad de mapear el audio al texto con marcas de tiempo reduce significativamente el tiempo transcurrido en la revisión de las transcripciones”, explica el cofundador de Happy Scribe, André Bastie, cuya compañía utiliza Cloud Speech para su servicio de transcripción de entrevistas.

También aumenta el tiempo de los archivos que los desarrolladores pueden subir al servicio, que pasa de los 80 minutos de la versión anterior hasta a 3 horas de duración. Los desarrolladores también pueden solicitar una extensión de cuota para cargar archivos aún más largos. Al igual que hasta ahora, los desarrolladores pueden obtener 60 minutos de procesamiento de audio gratuito a través de la API de voz y facturar 0,006 dólares cada 15 segundos adicionales.

Juan Miguel Revilla

Recent Posts

Los ingresos anuales recurrentes de IFS crecen un 30%

La compañía ha registrado durante el tercer trimestre incrementos del 20 % en ingresos por…

11 horas ago

Fujitsu lanza una IA que piensa de forma autónoma y colabora con humanos

Fujitsu Kozuchi AI Agent se ofrecerá a través de la plataforma Fujitsu Data Intelligence PaaS.

12 horas ago

Los dispositivos TOUGHBOOK se certifican con Red Hat Enterprise Linux

De momento han sido certificados los modelos TOUGHBOOK 55mk3 y TOUGHBOOK 33mk4.

12 horas ago

Carmen Boronat, nueva CEO de la consultora Cloud District

El objetivo de esta compañía, especializada en productos digitales, es ayudar a las organizaciones combinando…

13 horas ago

Appian elige a Estefanía Vázquez como vicepresidenta de servicios financieros para Iberia y Latinoamérica

Entre sus cometidos están supervisar la implementación de proyectos y el desarrollo de iniciativas de…

14 horas ago

Los españoles están dispuestos a pagar más en Black Friday y Navidad para ayudar al pequeño comercio

Así lo afirma un 71 % de los consumidores encuestados por GoDaddy. Hasta una cuarta…

14 horas ago