El presidente del Gobierno, Pedro Sánchez, aprovechó su intervención en la clausura del encuentro ‘HispanIA: cómo la inteligencia artificial mejorará nuestro futuro’ para anunciar el desarrollo de ALIA, una infraestructura pública de inteligencia artificial (IA) en castellano y lenguas cooficiales, abierta y financiada al 100% con recursos públicos, tal y como contábamos hace unas semanas.
El proyecto está coordinado por el Barcelona Supercomputing Center —Centro Nacional de Supercomputación (BSC-CNS)—, con el impulso y liderazgo de la Secretaría de Estado de Digitalización e Inteligencia Artificial.
“El Gobierno de España impulsa ALIA con el objetivo de reforzar la soberanía tecnológica del país y posicionarlo como un referente en IA en Europa. Este proyecto busca reducir la dependencia de modelos internacionales, fomentar el uso del español y las lenguas cooficiales en el ámbito tecnológico y democratizar el acceso a la IA. Además, se alinea con la Estrategia de Inteligencia Artificial y el Reglamento Europeo de IA, promoviendo una tecnología transparente, responsable y accesible para la ciudadanía, las empresas y las instituciones públicas”, declara Marc Bara, profesor de OBS Business School.
“ALIA también responde a la necesidad de mejorar la competitividad económica de España mediante la innovación tecnológica, generando capacidades en sectores clave como la administración pública, la investigación científica y el desarrollo empresarial. Además, el presidente Pedro Sánchez destacó que esta iniciativa busca garantizar que España tenga un papel relevante en el desarrollo global de la IA, especialmente en idiomas distintos al inglés”, añade.
Al hilo de ello, Juan Ignacio Moreno, head of AI Solutions & Strategy de Innova-tsn, señala que “busca potenciar el español y las lenguas cooficiales, corrigiendo los sesgos y las limitaciones generadas por los modelos entrenados en inglés”.
“Los LLM que utilizamos han sido entrenados utilizando grandes cantidades de texto, denominado corpus, por empresas tecnológicas, principalmente estadounidenses, como Google, OpenAI, Meta… Esto significa que la mayor parte de ellos estaban escritos en inglés, por lo que es en este idioma donde funcionan con más precisión. Con ALIA, se pretende obtener LLM entrenados sobre textos escritos en las lenguas de nuestro país, lo que permitiría disponer de modelos de lenguaje optimizados en nuestros idiomas”, añade Pablo Méndez, director del área de Inteligencia Artificial de Altia.
Esto también podría servir para adquirir peso en todo el ámbito hispanoamericano, teniendo en cuenta que el español es la cuarta lengua más hablada del mundo, tras en inglés, el chino y el hindi. “La administración española ha considerado esencial que un país hispanohablante lidere el desarrollo de modelos de IA generativa específicamente entrenados en español”, comenta Pablo Beldarrain, líder de soluciones de IA Generativa de NEORIS.
Además, Moreno reseña que ALIA aspira a “reducir la dependencia de los modelos de IA controlados por grandes corporaciones estadounidenses y garantizar infraestructuras propias para evitar riesgos como pueden ser la censura, la pérdida de datos o las interrupciones en servicios críticos”.
De igual modo, Beldarrain dice que “esta iniciativa no sólo beneficia a España, sino que también representa un avance estratégico para Europa”. “En un contexto donde el desarrollo de la IA está dominado por gigantes tecnológicos estadounidenses, resulta crucial que Europa refuerce su independencia en esta área. La reciente aparición de DeepSeek, un LLM desarrollado en China con costes reducidos, evidencia cómo otras regiones ya están invirtiendo en modelos adaptados a sus propios idiomas y necesidades. Esto refuerza aún más la necesidad de que Europa tenga un papel activo en la evolución de la IA generativa”, remarca.
“ALIA es un modelo preentrenado de lenguaje. Para generar este modelo, se ha entrenado un sistema con un corpus de más de 17.000 millones de palabras, distribuidas en 34 millones de documentos. Es decir, es el equivalente a ChatGPT, pero en lugar de tener que pagar a una empresa estadounidense para poder utilizarlo, es de acceso libre y alimenta el ecosistema de innovación español”, explica Luis de la Fuente, subdirector de Investigación en la Escuela Superior de Ingeniería y Tecnología e investigador principal del grupo ‘Data Driven Science’ de la Universidad Internacional de La Rioja (UNIR).
Así pues, ALIA engloba una familia de modelos de IA con el objetivo de impulsar soluciones tecnológicas adaptadas a las características de nuestro país. “En concreto, actualmente se están implementando proyectos piloto para validar y evolucionar esta estrategia, como un chatbot interno en la Agencia Tributaria, para agilizar su funcionamiento y atención al ciudadano; y una aplicación en atención primaria que, mediante análisis avanzados de datos, mejora el diagnóstico precoz de insuficiencias cardíacas”, detalla José Antonio Lozano, head of AI & Business Innovation de Tokiota.
Además, Bara pone el acento en que estos proyectos han sido concebidos “con principios de ética y transparencia, minimizando sesgos y cumpliendo con el Reglamento Europeo de IA”.
Por otra parte, Moreno hace hincapié en que ALIA es un proyecto de código abierto, “lo que permite que tanto entidades públicas como privadas lo utilicen y adapten según sus necesidades”.
En este sentido, el experto de OBS Business School explica que ALIA “ofrece recursos accesibles para investigadores, empresas y desarrolladores, incluyendo herramientas como ‘ALIA Kit’ para aplicaciones comerciales, educativas y científicas”.
Otro aspecto que distingue a ALIA del resto de modelos de IA generativa más conocidos es su esquema de financiación y apoyo, con una inversión inicial de 10,1 millones de euros. “Cuenta con respaldo de la administración pública, a través de fondos europeos y españoles, lo que garantiza su viabilidad y proyección a largo plazo. Asimismo, se prevén ayudas específicas para fomentar el desarrollo de aplicaciones en sectores estratégicos como la salud, la administración pública y la investigación”, detalla el responsable de NEORIS.
Y también subraya la importancia de que el proyecto cuente con el apoyo del Barcelona Supercomputing Center. “El entrenamiento de modelos de lenguaje de gran escala requiere una capacidad computacional masiva, una inversión que sólo pueden asumir la administración pública europea o gigantes tecnológicos estadounidenses y chinos. En este sentido, ALIA cuenta con el respaldo del supercomputador de Barcelona, lo que le permite competir con otras grandes infraestructuras internacionales. Esta apuesta por la autonomía tecnológica europea supone una diferencia significativa con respecto a proyectos anteriores”, aclara.
Además de su carácter abierto y público, no cabe la menor duda de que elemento diferencial de ALIA es su enfoque en el español y las distintas lenguas cooficiales de nuestro país: gallego, vasco, catalán y valenciano.
“La principal diferencia es el corpus de texto sobre el que se entrena el modelo: una colección de textos de alta calidad, no extraídos sin más de internet, en los idiomas objetivo. Este corpus también será abierto y disponible para cualquier organismo del planeta que quiera entrenar un LLM que sea versado en nuestros idiomas. Además, gracias al esmero y los estándares de calidad con los que se construye este corpus, no presentarán problemas sobre la propiedad intelectual, como sucede con otros corpus descargados de internet”, asegura Méndez.
Además, reseña que “la familia de modelos de ALIA es escalable, con variados tamaños adaptados a las necesidades de diferentes sectores, desde pequeñas empresas hasta organismos públicos, facilitando así su adopción”. Y también destaca que “ALIA promueve la sostenibilidad mediante la eficiencia energética y la reducción de la huella de carbono”.
En el mercado ya hay varios modelos de lenguaje, por lo que cabe plantearse si realmente merece la pena afrontar un proyecto de estas características con financiación pública.
“Aunque ALIA se presenta con características distintivas, un análisis detallado revela que estas diferencias podrían no ser tan significativas como se plantean. El modelo presume de un entrenamiento desde cero, usando el supercomputador MareNostrum 5, procesando 6,9 billones de tokens en 35 idiomas europeos. Sin embargo, los resultados cuestionan la eficacia de este enfoque”, apunta Bara.
“La realidad es que ALIA llega a un ecosistema donde ya existen soluciones multilingües altamente competentes. Los datos de rendimiento son particularmente reveladores. En pruebas estándar de comprensión del lenguaje natural (NLI), ALIA alcanza apenas un 51,77% de precisión en la prueba XNLI_en, mientras que Llama 2, lanzado en julio de 2023, logra un 66%. En tareas de respuesta a preguntas, la brecha es aún más significativa. ALIA obtiene un 81,53% en SQuAD_en, frente al 93-94% de Llama 2. Estos números no son sólo estadísticas, sino que representan la capacidad real del modelo para comprender y procesar el lenguaje natural, una habilidad fundamental para cualquier aplicación práctica”, aclara.
De este modo, considera que “la justificación de desarrollar un modelo propio español podría residir en argumentos de soberanía tecnológica y control sobre los datos”. Sin embargo, piensa que “el enfoque actual de ALIA genera dudas significativas sobre su capacidad para cumplir incluso con este objetivo”.
“A pesar de presentarse como una herramienta para potenciar el español, sólo el 16,12% de sus datos de entrenamiento están en nuestro idioma, mientras que el inglés domina, con un 39,31%. Esta distribución lingüística se refleja en su rendimiento. El modelo muestra mejores resultados en inglés que en español, contradiciendo su propósito fundamental”, advierte.
Asimismo, subraya que “el aspecto económico resulta especialmente preocupante cuando se considera la alternativa señalada por expertos del sector”. “Ingenieros de Google han apuntado que un proceso de adaptación (fine-tuning) de modelos existentes con 17 billones de tokens podría haber producido resultados superiores a una fracción del costo actual. Esta observación cobra especial relevancia cuando se considera que las tablas comparativas con Llama 2 fueron eliminadas de la documentación oficial, generando preocupación sobre la transparencia en la gestión de recursos públicos”, comenta.
Por otra parte, señala que los proyectos piloto anunciados para ALIA, mencionados más arriba, “aunque interesantes, no parecen justificar la magnitud de la inversión realizada”.
“La verdadera necesidad, quizás, no residía en desarrollar un modelo desde cero, sino en fortalecer la infraestructura digital básica de la administración pública, un área donde las carencias son evidentes y el impacto en la ciudadanía sería inmediato”, valora.
“Podríamos decir que, aunque la intención detrás de ALIA puede ser loable —promover la innovación tecnológica española y la independencia en IA— la ejecución actual sugiere que no era la aproximación más necesaria ni eficiente. Un enfoque más estratégico habría sido invertir en la especialización de modelos existentes para casos de uso específicos de la administración pública española, combinado con una mejora sustancial de la infraestructura digital básica”, concluye.
Pese a ello, otros expertos creen que un proyecto como éste sí que es necesario. Por ejemplo, el responsable de Innova-tsn pone el acento en que ALIA aborda “tres problemas críticos”.
“Por un lado, la brecha lingüística, dado que el español es el tercer idioma más hablado en internet, pero pocos modelos de IA se entrenan en este idioma, lo que causa sesgos en sectores clave como Medicina o Derecho”, expone.
“Es cierto que la precisión de las traducciones de los modelos fundacionales estadounidenses y chinos cuando se interactúa en español es muy alta, pero el entrenamiento del modelo fundacional ALIA con un corpus documental mayoritariamente local puede mejorar la adaptabilidad del mismo a las necesidades específicas de los ciudadanos españoles”, agrega.
Asimismo, el director de IA de Altia cree que “todos los estados deberían disponer de modelos de lenguaje entrenados sobre corpus extensos de texto escritos en las lenguas que hablan sus ciudadanos”, puesto que sólo de esta forma podrán desarrollarse las mejores soluciones basados en la IA lingüística, generativa o no”..
El segundo aspecto se refiere a la autonomía estratégica, “ya que la dependencia de modelos extranjeros conlleva que datos sensibles se procesen fuera de España y de la Unión Europea, afectando la privacidad y seguridad”, afirma el experto de Innova-tsn.
“Era necesaria una política que genere competitividad, con modelos y herramientas que puedan competir en este mercado y que tengan su sede dentro de la Unión Europea”, coincide el profesor de UNIR. “Es importante que España y la Unión Europea sigan dando pasos en ese sentido para alcanzar mayor autonomía tecnológica y competir con otras potencias como Estados Unidos y China”, añade Lozano.
Y el último frente abierto tiene que ver con la innovación inclusiva, “ya que ALIA, al ser una infraestructura pública y de código abierto, democratiza el acceso a la IA, impulsando la competitividad y el desarrollo tecnológico local”, aclara Moreno.
Igualmente, el representante de Tokiota opina que “este proyecto también ayuda a democratizar entre las pequeñas y medianas empresas tecnologías avanzadas, lo que contribuye a aumentar su competitividad”, puesto que brinda a las empresas la oportunidad de crear aplicaciones personalizadas, potenciando su competitividad en el mercado.
“El hecho de que la licencia sea abierta implica que los usuarios tienen libertad total para utilizarlo, sin estar sujeto a licencias que puedan cambiar en el tiempo”, añade el profesor de UNIR.
Por otro lado, Beldarrain pone el acento en que esta iniciativa puede ser fundamental para impulsar la atracción y retención de talento. “España posee un enorme potencial en talento tecnológico e ingeniería, pero aún no se ha consolidado como un hub de referencia en el ámbito global. Algunas ciudades, como Málaga, ya se han convertido en polos tecnológicos con una creciente comunidad de desarrolladores y profesionales de IA. Este proyecto contribuirá a fortalecer esa tendencia y expandirla a otras zonas del país, consolidando a España como un centro de innovación en IA”, explica.
Las posibles aplicaciones de ALIA son muchas y se extienden a diversos sectores. “Ahí donde se necesite que computadores interacciones con las personas en lenguaje natural o entender información escrita en texto libre, se podrá aplicar ALIA: chatbots de última generación especializados en nuestros idiomas, extraer información estructurada de texto no estructurado que evite mecanizar mucha información por humanos, los mejores traductores de texto entre nuestras lenguas cooficiales, explotación de texto libre como los informes médicos, resúmenes de textos de prensa o judiciales y un largo etcétera”, enumera el director del área de IA de Altia.
Por ejemplo, De la Fuente indica que las empresas y administraciones españolas podrán utilizar ALIA para generar chatbots que faciliten el servicio con sus usuarios. “Es un competidor más en el mercado de los LLM, con la característica de ser de uso libre y elaborado en un contexto nuestro”, expone.
Asimismo, el responsable de Innova-tsn señala que “el acceso digitalizado a los servicios públicos soportado por ALIA podría resultar especialmente beneficioso por el conocimiento de la regulación específica y la estructura organizativa de la Administración”.
Igualmente, Beldarrain piensa que “contribuirá a la optimización de servicios y a la mejora en la gestión de ayudas y recursos, especialmente en sectores clave como la asistencia a personas con necesidades especiales”, puesto que permitirá automatizar procesos burocráticos, mejorar la comunicación con los ciudadanos y ofrecer soluciones más ágiles y eficientes.
Beldarrain sostiene que “su uso permitirá acelerar procesos científicos mediante el análisis avanzado de imágenes y la optimización de grandes volúmenes de datos”, ya que la IA generativa “supondrá un salto cualitativo en la capacidad de los científicos para interpretar información y extraer conclusiones de forma más rápida y precisa”.
Del mismo modo, augura que “ALIA tendrá un impacto significativo al mejorar la detección de enfermedades como el cáncer, la personalización de tratamientos y la optimización de la gestión de recursos médicos”. “Desde el análisis de historiales clínicos hasta el desarrollo de herramientas de apoyo para el personal sanitario, la IA artificial generativa facilitará el acceso a diagnósticos más precisos y a sistemas más eficientes en la atención médica”, agrega.
Lozano también cree que podrá facilitar la traducción de información hacia y desde el español y las lenguas cooficiales en las que ha sido entrenada esta IA. “Gracias a la automatización que aporta la inteligencia artificial, se consigue traducir contenidos de forma eficiente y precisa, reduciéndose los esfuerzos de la administración y de las compañías para mantener la cooficialidad lingüística”.
En resumen, el experto de OBS Business School considera que los principales beneficiarios de ALIA serán “instituciones académicas y de investigación, que podrían estudiar y mejorar el modelo gracias a su código abierto; administraciones públicas que buscan soluciones adaptadas a marcos regulatorios locales; y empresas tecnológicas españolas, que podrían desarrollar aplicaciones específicas”.
Moreno prevé que ALIA “puede ofrecer beneficios significativos en distintos ámbitos, especialmente para las pymes, la ciudadanía y el posicionamiento de España en Europa en materia de IA”.
En el ámbito empresarial, afirma que puede ayudar a reducir los costes del uso de IA, “gracias al acceso a modelos públicos y abiertos y a posibles subvenciones gubernamentales que fomenten la adopción de IA, impulsando la innovación y competitividad”.
En el caso de la ciudadanía, afirma que “la implementación de ALIA en servicios públicos podría mejorar la rapidez y precisión en áreas como la sanidad y la administración tributaria, traduciéndose en diagnósticos médicos más ágiles, trámites fiscales simplificados y una mejor interacción con la administración”.
En el plano institucional, considera que esta iniciativa “refuerza la identidad cultural de España, adaptando la IA a lenguas cooficiales, asegurando que los hablantes de catalán, gallego, euskera y valenciano accedan a tecnología avanzada sin barreras lingüísticas y preservando la diversidad cultural del país”.
Finalmente, piensa que ALIA hace que nuestro país se posicione como un jugador importante en IA ética y multilingüe en el contexto europeo, “contribuyendo a la soberanía tecnológica europea y fortaleciendo la independencia del continente frente a modelos controlados por grandes corporaciones extranjeras, promoviendo un desarrollo tecnológico basado en la transparencia y accesibilidad”.
Además, Bara piensa que ALIA nace con importantes limitaciones frente a la competencia ya establecida en el mercado, como veíamos antes. Por ello, considera que “una estrategia más efectiva para la soberanía tecnológica podría haber sido invertir en la adaptación y especialización de modelos existentes para necesidades específicas españolas, combinado con el desarrollo de infraestructura digital robusta y la formación de talento local en IA”.
La multinacional española aggity concluye su reorganización estratégica para enfocarse en áreas de negocio más…
Tras registrar el año pasado una mejoría del 10 %, IDC prevé para el presente…
Dotado de 20 millones de euros, las inversiones iniciales de este fondo llegarán al medio…
Ya disponible en España, alcanza velocidades bajada y subida de hasta 1,3 Gb/s y 900…
SpainDC celebra el Día Internacional de los Centros de Datos, destacando su impacto en la…
Cambium Networks afirma que "la inteligencia artificial ha llegado para quedarse, y con ella, los…