AMD ya tiene lista y disponible en el mercado una nueva familia de aceleradores AMD Instinct MI300.
Se trata de los AMD Instinct MI300X, que prometen mejorías en ancho de banda de memoria para inteligencia artificial generativa, con un máximo de 5,3 TB/s.
Estos aceleradores funcionan con la arquitectura AMD CDNA 3. Cuentan con 192 GB de capacidad de memoria HBM3 y potencian el rendimiento para el entrenamiento y la inferencia de modelos de lenguaje grandes.
En comparación con los anteriores MI250X, ofrecen 1,5 veces más capacidad de memoria, 1,7 veces más ancho de banda de memoria teórica máxima y alrededor de un 40 % más de unidades de cómputo. También introducen soporte para FP8 y sparsity.
AMD ha presentado también la unidad de procesamiento acelerado Instinct MI300A con GPU CDNA 3 y CPU Zen 4.
Esta APU de centro de datos para computación de alto rendimiento e inteligencia artificial, aprovecha la arquitectura AMD Infinity de cuarta generación. Con 128 GB de memoria HBM3, ofrece casi el doble de rendimiento por vatio en cargas de trabajo que MI250X.
“Los aceleradores AMD Instinct de la serie MI300 están diseñados con nuestras tecnologías más avanzadas, brindan un rendimiento líder y estarán en implementaciones empresariales y de nube a gran escala”, declara Victor Peng, presidente de AMD.
Este directivo destaca el “enfoque de ecosistema abierto” para que “los proveedores de nube, OEM y ODM” puedan entregar “tecnologías que permiten a las empresas adoptar e implementar soluciones impulsadas por IA”.
Así, por ejemplo, Microsoft Azure ND MI300X v5 Virtual Machine funciona con MI300X, al igual que los servidores PowerEdge XE9680 de Dell.
Por su parte, el blade HPE Cray Supercomputing EX255a y el superordenador El Capitan del Laboratorio Nacional Lawrence Livermore están equipados con APUs MI300A.
Otro anuncio de AMD es la plataforma de software abierto AMD ROCm 6, que incrementa el rendimiento de aceleración de inteligencia artificial unas 8 veces con aceleradores de la serie MI300 en Llama 2 y que es compatible con FlashAttention, HIPGraph y vLLM.
Bienvenido a un nuevo episodio del podcast semanal Silicon Pulse, un espacio en el que…
Asistimos al primer encuentro con los medios de Paco Salcedo como presidente de Microsoft España,…
Kaspersky presentó en León su estrategia de canal 2025, destacando el crecimiento en MSP/MSSP, la…
Respaldado por el centro de capacidades de DXC en Zaragoza, cuenta con más de un…
La solución de EasyVista aglutina gestión de servicios de TI y de dispositivos, monitorización de…
Los objetivos son democratizar el uso de una inteligencia artificial responsable e impulsar la competitividad…