AIU, de IBM, para el futuro de IA y el Deep Learning
IBM desarrolla AIU, la unidad de Inteligencia Artificial que afrontará los retos del Deep Learning del futuro.
Hoy en día, el Deep Learning se aplica para la clasificación de imágenes dependiendo de su contenido, la traducción de idiomas, la detección de tumores u otras aplicaciones en muy diversos campos. Desde IBM admiten que se están quedando sin poder de cálculo debido a que los modelos de IA están creciendo exponencialmente pero el hardware para ejecutarlos, ya sea en servidores de la nube o en dispositivos periféricos, no han evolucionado tan rápido.
Tecnología obsoleta
Ante tal escenario, IBM Research AI Hardware Center ha decidido crear la Unidad de Inteligencia Artificial, AIU por su siglás en inglés. Este centro de Investigación para la Inteligencia Artificial de IBM se fundó en 2019 con el propósito de mejorar la eficiencia del hardware destinado a la IA en 2,5 veces por año.
Las CPU de la informática tradicional se diseñaron antes de la aparición del Deep Learning como forma de aprendizaje automático para las predicciones basadas en grandes conjuntos de datos. Estos chips están bien diseñados para hacer funcionar las aplicaciones de software tan comunes hasta ahora. Esas mismas cualidades no son tan potentes ni tan precisas a la hora de entrenar y ejecutar modelos de aprendizaje profundo que requieren las operaciones de la Inteligencia Artificial.
Un Chip para la IA
Reconocen, desde IBM, que durante la última década se han estado ejecutando los modelos de Deep Learning en CPU y GPU cuando lo que la tecnología actual demanda es un nuevo desarrollo de chip. La respuesta de IBM a esta necesidad es AIU, un chip multipropósito optimizado para los tipos de operaciones de multiplicación de vectores y matrices empleadas en el aprendizaje profundo.
IBM AIU es un circuito integrado de aplicación específica (ASIC), diseñado para el Deep Learning y que se puede programar para ejecutar tareas, como por ejemplo, el procesamiento de lenguajes hablados.
Características de AIU
Tal y como afirman en IBM, AIU no ha sido diseñado desde cero, sino que se trata de una versión escalada del acelerador de IA ya integrado en su chip Telum. Este nuevo Chip también cuenta con 32 núcleos de procesamiento y cuenta con 23.000 millones de transistores, acercándose mucho a la cifra que se incluye en su chip z16.
Otro aspecto característico es que, mientras que Telum cuenta con transistores de 7nm, AIU posee transistores de 5 nm, una tamaño menor pero que garantiza una mayor rapidez. Además, el nuevo chip AIU puede conectarse a cualquier ordenador o servidor que cuente con una ranura PCIe.
Dos premisas para el diseño
IBM ha seguido la premisa de que un chip de IA no tiene que ser tan preciso como una CPU. IBM ha desarrollado una técnica llamada “Approximate computing” (Computación aproximada), que le permite pasar de la aritmética de punto flotante de 32 bits a formatos que contienen la cuarta parte de información. Con esta simplificación, se reduce el número de cálculos numéricos para entrenar y ejecutar la inteligencia artificial sin sacrificar la precisión, ganando velocidad y no requiriendo tanta memoria.
Por otro lado, el diseño de AIU está pensado para reducir los flujos de trabajo. Ya que la mayoría de los cálculos de IA involucran la multiplicación de matrices y vectores, AIU posee una arquitectura mucho más simple que una CPU multiproposito, que le permite enviar datos directamente de un motor de cómputo al siguiente, suponiendo una enorme ahorro de energía.
La ruta de IBM
Con el chip AIU, IBM pretende afrontar los desafíos que presenta el futuro de la Inteligencia Artificial y el Deep Learning. Con los núcleos integrados en Telum y ahora con este nuevo chip especializado en IA, IBM tiene el objetivo de mejorar los tiempos y los gastos que implica la formación y la ejecución de los modelos de aprendizaje profundo ofreciendo de esta manera unas ventajas muy atractivas para las empresas.