AMD ya tiene lista y disponible en el mercado una nueva familia de aceleradores AMD Instinct MI300.
Se trata de los AMD Instinct MI300X, que prometen mejorías en ancho de banda de memoria para inteligencia artificial generativa, con un máximo de 5,3 TB/s.
Estos aceleradores funcionan con la arquitectura AMD CDNA 3. Cuentan con 192 GB de capacidad de memoria HBM3 y potencian el rendimiento para el entrenamiento y la inferencia de modelos de lenguaje grandes.
En comparación con los anteriores MI250X, ofrecen 1,5 veces más capacidad de memoria, 1,7 veces más ancho de banda de memoria teórica máxima y alrededor de un 40 % más de unidades de cómputo. También introducen soporte para FP8 y sparsity.
AMD ha presentado también la unidad de procesamiento acelerado Instinct MI300A con GPU CDNA 3 y CPU Zen 4.
Esta APU de centro de datos para computación de alto rendimiento e inteligencia artificial, aprovecha la arquitectura AMD Infinity de cuarta generación. Con 128 GB de memoria HBM3, ofrece casi el doble de rendimiento por vatio en cargas de trabajo que MI250X.
“Los aceleradores AMD Instinct de la serie MI300 están diseñados con nuestras tecnologías más avanzadas, brindan un rendimiento líder y estarán en implementaciones empresariales y de nube a gran escala”, declara Victor Peng, presidente de AMD.
Este directivo destaca el “enfoque de ecosistema abierto” para que “los proveedores de nube, OEM y ODM” puedan entregar “tecnologías que permiten a las empresas adoptar e implementar soluciones impulsadas por IA”.
Así, por ejemplo, Microsoft Azure ND MI300X v5 Virtual Machine funciona con MI300X, al igual que los servidores PowerEdge XE9680 de Dell.
Por su parte, el blade HPE Cray Supercomputing EX255a y el superordenador El Capitan del Laboratorio Nacional Lawrence Livermore están equipados con APUs MI300A.
Otro anuncio de AMD es la plataforma de software abierto AMD ROCm 6, que incrementa el rendimiento de aceleración de inteligencia artificial unas 8 veces con aceleradores de la serie MI300 en Llama 2 y que es compatible con FlashAttention, HIPGraph y vLLM.
Dell pretende que "las organizaciones puedan utilizar continuamente los últimos avances de IA en el…
Introduce cinco nuevas soluciones HPE Cray con arquitectura de refrigeración líquida directa y dos servidores…
Las entradas para acudir a este parque temático que defiende un turismo sostenible saldrán a…
Amplía la disponibilidad de actualizaciones y parches críticos para ambos sistemas operativo hasta agosto de…
Con esta actualización acelera las cargas de trabajo de Kubernetes para máquinas virtuales, bases de…
Su cometido pasa por consolidar y ampliar el ecosistema industrial en España y Portugal.