En esta tribuna, Enric Delgado, director de Client Engineering Team de España, Portugal, Grecia e Israel, destaca cinco razones por las que los modelos de lenguaje más pequeños (SLM) ofrecen a las empresas una alternativa eficiente, rentable y sostenible frente a los grandes modelos de lenguaje (LLM).
Desde que ChatGPT irrumpió en escena hace dos años, la mayor parte de la conversación en torno a la IA generativa se ha centrado en los grandes modelos de lenguaje (LLM) y su impresionante capacidad para procesar grandes conjuntos de datos.
Sin embargo, a medida que más empresas superan el bombo inicial y comienzan a implementar la IA, están descubriendo que los LLM complejos no siempre son adecuados para sus casos de uso. El primer gran inconveniente es que muchos LLM propietarios operan en un entorno que funciona como una “caja negra”, con una transparencia limitada en los datos con los que se entrenan. En segundo lugar, la mayoría de los LLM son modelos de propósito general. Aunque se pueden utilizar para una amplia gama de tareas, son difíciles de adaptar con datos propios de la empresa que ajusten ese modelo a las necesidades particulares de una compañía.
Esta falta de transparencia y control, junto con los altos costes de implementación y mantenimiento, puede reducir el valor de la IA generativa dentro de una organización y perjudicar las expectativas de retorno de la inversión (ROI). Afortunadamente, existe una alternativa que está ganando adeptos: los modelos de lenguaje más pequeños (SLM).
Al operar a partir de conjuntos de datos más pequeños pero más curados y con menos parámetros, los SLM permiten a las organizaciones aprovechar la precisión, el poder y los conocimientos de la IA generativa usando sus propios datos y sin los inconvenientes de los LLMs. Y los beneficios hablan por sí solos…
1. Rentabilidad
Según un estudio reciente del IBM Institute for Business Value se espera que el coste medio de la computación aumente un 89% entre 2023 y 2025, y el 70% de los ejecutivos afirma que la IA generativa está desempeñando un papel clave en el impulso de este aumento. Como resultado, el 15% de los proyectos de IA se han suspendido y el 21% no han logrado escalar.
Aunque el coste que conlleva implementar la IA es una de las mayores barreras para su adopción, los SLM se postulan como una solución. Con menores requisitos computacionales, consumo de energía, costes de almacenamiento y mantenimiento, los SLM suponen un ahorro de costes significativo para las empresas, lo que les permite comenzar poco a poco a implementarla y tener la libertad de escalar según sea necesario.
2. Compatibilidad con los objetivos de sostenibilidad
Para muchas empresas, la sostenibilidad es, junto a la innovación tecnológica, una sus principales prioridades. Sin embargo, el gran consumo de energía asociado con los LLM puede ser difícil de encajar con los objetivos de reducción de carbono.
El impacto ambiental de los LLM viene dado por su gran tamaño, es decir, el consumo de energía asociado con el entrenamiento de grandes conjuntos de datos y los vastos recursos eléctricos y de enfriamiento necesarios para almacenar y mover los datos. Pero no solo es el entrenamiento (la creación del modelo) sino su inferencia (su uso): usar un LLM unas cuantas veces para hacer un piloto no es relevante, pero en un entorno de producción donde ese LLM pase a usarse de forma constante, centenares o miles de veces al día, implica unos costes energéticos que ya pasan a ser significativos.
Al reducir los parámetros y el tamaño del conjunto de datos a través de los SLM, las empresas pueden elegir modelos de IA diseñados para obtener una mayor rapidez y eficiencia energética, procesando la información de manera más efectiva y utilizando menos energía.
3. Flexibilidad de implementación
Los SLM pueden ser suficientemente pequeños para ser implementados en teléfonos inteligentes y dispositivos periféricos, lo que significa que se pueden ejecutar de forma local o sin conexión. Esto no solo proporciona a los usuarios un mayor control sobre el acceso a sus datos, sino que significa que pueden aprovecharlos para una nueva gama de casos de uso en áreas donde el acceso a Internet es limitado, como la agricultura o la energía en alta mar. Esto significa que también pueden estar más disponibles en países y comunidades de todo el mundo que carecen de Internet de alta velocidad.
4. Mejora del control de riesgos
El caso de uso de IA más impactante se logrará aprovechando los datos propietarios de las empresas para ajustar los modelos fundacionales para realizar tareas específicas. Los SLM, especialmente aquellos construidos a partir de conjuntos de datos filtrados, relevantes y transparentes, permiten a las organizaciones saber qué datos están utilizando y mezclarlos con los suyos.
La mayoría de los LLM se entrenan utilizando datos públicos de Internet, lo que aumenta el riesgo de resultados sesgados o inapropiados. En comparación, muchos de los modelos más pequeños que salen al mercado se entrenan con datos filtrados relevantes para la empresa que son totalmente transparentes. Esto reduce el riesgo de sesgo y resultados problemáticos. Estos conjuntos de datos más pequeños facilitan el seguimiento y la trazabilidad de dichos datos, lo que simplifica la gobernanza y la supervisión humana.
5. Preparado para la personalización
Con los SLM, las compañías pueden lograr el equilibrio adecuado entre poder y control: pueden ofrecer un alto rendimiento en tareas específicas con menos recursos. El hecho de que los LLM sean de “talla única” limita su capacidad de personalización. Por otro lado, los SLM pueden ser ágiles y fácilmente adaptables, lo que permite a los desarrolladores ajustarlos a las necesidades únicas de cada empresa y a áreas específicas de conocimiento como, por ejemplo, los servicios financieros. También permiten una mayor flexibilidad de los enfoques híbridos y multimodelo.
Satisfacer la demanda
Existen en el mercado modelos más recientes que incluyen SLM de código abierto que son capaces de igualar el rendimiento de modelos mucho más grandes y con un coste mucho menor. Optar por modelos de este tipo proporciona a las empresas una IA más personalizable y potente para cubrir sus necesidades e impulsar el valor empresarial real gracias a la tecnología.
En el punto en el que estamos y, de cara a 2025, los CEOs y CIOs deberían explorar la gama de modelos disponibles en el mercado, empezando por los más pequeños y ampliándolos solo si hace falta. Es así como las empresas podrán aprovechar verdaderamente el valor que ofrece la IA y lograr una ventaja competitiva sostenible en un entorno cada vez más dinámico.