Facebook logra traducir entre un centenar de idiomas sin basarse en el inglés

En el mundo existen 7000 idiomas diferentes. En España, por ejemplo, hay varias lenguas que son oficiales junto al castellano.

Para no perder esa riqueza y, al mismo tiempo, facilitar la comunicación, la industria tecnológica trabaja en herramientas de traducción que permitan reconocer al instante qué dice un texto o qué está contando la persona que se tiene delante aunque hable en un idioma desconocido. Aquí la inteligencia artificial juega un papel fundamental.

Facebook está investigando en esta parcela y ha anunciado un hito: un modelo de traducción automática multilingüe masivo. Bautizado como M2M-100, es capaz de traducir 100 idiomas diferentes en cualquier dirección sin pasar necesariamente por el inglés, como suele ocurrir en estos casos.

Otros sistemas de traducción se apoyan en modelos de inteligencia artificial separados para cada idioma o confían en el inglés como punto de referencia. “Es mucho más fácil encontrar traducciones del chino al inglés y del inglés al francés que, digamos, del francés al chino”, explica la ayudante de investigación Angela Fan. ¿Por qué? “Porque los datos de entrenamiento en inglés son los más disponibles”.

Facebook ha tomado otro camino y ha decidido construir un conjunto de datos diverso, con 7500 millones de oraciones paralelas en un centenar de idiomas.

Para ello, ha usado técnicas de escalado que le han permitido construir un modelo con 15 000 millones de parámetros. Ha aprovechado recursos de minería de datos ya existentes como ccAligned, ccMatrix y LASER. Y ahora publica su trabajo como código abierto a través de GitHub.

La red social asegura que este nuevo modelo multilingüe ha conseguido una mejora de 10 puntos en la métrica BLEU de evaluación de traducciones respecto a alternativas centradas en el inglés.

Mónica Tilves

Licenciada en Xornalismo por la Universidad de Santiago de Compostela en la especialidad de Periodismo Electrónico y Multimedia. Apasionada de los gadgets, la fotografía digital, el diseño web y el arte. Tras un primer contacto con el mundo de la prensa escrita y con la suficiencia investigadora debajo del brazo, me decanto por los medios online. Cubro la actualidad informativa en Silicon Week desde 2011, además de colaborar en otras publicaciones del grupo NetMediaEurope en España como Silicon News. Ahora en Silicon.es.

Recent Posts

Los mensajes RCS, otra vía de acceso para ciberataques

Los mensajes RCS ofrecen muchas más posibilidades que los SMS, pero también abren la puerta…

1 día ago

Telefónica Empresas ayudará a Microsoft a expandir los Copilot+ PC por España

Acompañará a las empresas en sus procesos de equipamiento, desde la elección del hardware hasta…

2 días ago

IBM y Esade promueven el uso de la IA en los Consejos de Administración

Juntos, trabajarán en la formación y la actualización de habilidades para que los consejeros impulsen…

2 días ago

ASUS lanza un Mini PC con inteligencia artificial

Este dispositivo incluye entre sus especificaciones procesador Intel Core Ultra (Serie 2) y botón Copilot.

2 días ago

EasyVisa adquiere una participación mayoritaria en OTRS Group

Ya cuenta en su poder con más del 90 % de las acciones del proveedor…

2 días ago

SoftwareOne y Crayon acuerdan fusionarse

Los actuales consejeros delegados, Raphael Erb y Melissa Mulholland, se convertirán en co-CEOs de la…

2 días ago