Facebook logra traducir entre un centenar de idiomas sin basarse en el inglés

En el mundo existen 7000 idiomas diferentes. En España, por ejemplo, hay varias lenguas que son oficiales junto al castellano.

Para no perder esa riqueza y, al mismo tiempo, facilitar la comunicación, la industria tecnológica trabaja en herramientas de traducción que permitan reconocer al instante qué dice un texto o qué está contando la persona que se tiene delante aunque hable en un idioma desconocido. Aquí la inteligencia artificial juega un papel fundamental.

Facebook está investigando en esta parcela y ha anunciado un hito: un modelo de traducción automática multilingüe masivo. Bautizado como M2M-100, es capaz de traducir 100 idiomas diferentes en cualquier dirección sin pasar necesariamente por el inglés, como suele ocurrir en estos casos.

Otros sistemas de traducción se apoyan en modelos de inteligencia artificial separados para cada idioma o confían en el inglés como punto de referencia. “Es mucho más fácil encontrar traducciones del chino al inglés y del inglés al francés que, digamos, del francés al chino”, explica la ayudante de investigación Angela Fan. ¿Por qué? “Porque los datos de entrenamiento en inglés son los más disponibles”.

Facebook ha tomado otro camino y ha decidido construir un conjunto de datos diverso, con 7500 millones de oraciones paralelas en un centenar de idiomas.

Para ello, ha usado técnicas de escalado que le han permitido construir un modelo con 15 000 millones de parámetros. Ha aprovechado recursos de minería de datos ya existentes como ccAligned, ccMatrix y LASER. Y ahora publica su trabajo como código abierto a través de GitHub.

La red social asegura que este nuevo modelo multilingüe ha conseguido una mejora de 10 puntos en la métrica BLEU de evaluación de traducciones respecto a alternativas centradas en el inglés.

Mónica Tilves

Licenciada en Xornalismo por la Universidad de Santiago de Compostela en la especialidad de Periodismo Electrónico y Multimedia. Apasionada de los gadgets, la fotografía digital, el diseño web y el arte. Tras un primer contacto con el mundo de la prensa escrita y con la suficiencia investigadora debajo del brazo, me decanto por los medios online. Cubro la actualidad informativa en Silicon Week desde 2011, además de colaborar en otras publicaciones del grupo NetMediaEurope en España como Silicon News. Ahora en Silicon.es.

Recent Posts

Snowflake llega a un acuerdo con Datavolo para su adquisición

Como resultado de esta operación, ampliará sus servicios en el "bronze layer" del ciclo de…

14 mins ago

NetApp aumenta un 6 % sus ingresos trimestrales

Durante el segundo trimestre de su año fiscal 2025 acumuló 1.660 millones de dólares, la…

51 mins ago

Denodo Platorm 9.1 estrena asistente de inteligencia artificial

También incluye un SDK open source para potencia el desarrollo de aplicaciones y agentes, especialmente…

1 hora ago

El 77 % del flujo de spam por Black Friday es una estafa

Los ciberdelincuentes recurren a ofertas que no son ciertas, tarjetas regalo y sorteos para robar…

2 horas ago

Así es el smartphone nubia Z70 Ultra

Entre sus características incluye una pantalla de ultra alta resolución 1.5K y lente dinámica biónica.

3 horas ago

Silicon Pulse: Titulares de la semana #33

Bienvenido a un nuevo episodio del podcast semanal Silicon Pulse, un espacio en el que…

13 horas ago