Ya está disponible la serie AMD Instinct MI300

AMD ya tiene lista y disponible en el mercado una nueva familia de aceleradores AMD Instinct MI300.

Se trata de los AMD Instinct MI300X, que prometen mejorías en ancho de banda de memoria para inteligencia artificial generativa, con un máximo de 5,3 TB/s.

Estos aceleradores funcionan con la arquitectura AMD CDNA 3. Cuentan con 192 GB de capacidad de memoria HBM3 y potencian el rendimiento para el entrenamiento y la inferencia de modelos de lenguaje grandes.

En comparación con los anteriores MI250X, ofrecen 1,5 veces más capacidad de memoria, 1,7 veces más ancho de banda de memoria teórica máxima y alrededor de un 40 % más de unidades de cómputo. También introducen soporte para FP8 y sparsity.

AMD ha presentado también la unidad de procesamiento acelerado Instinct MI300A con GPU CDNA 3 y CPU Zen 4.

Esta APU de centro de datos para computación de alto rendimiento e inteligencia artificial, aprovecha la arquitectura AMD Infinity de cuarta generación. Con 128 GB de memoria HBM3, ofrece casi el doble de rendimiento por vatio en cargas de trabajo que MI250X.

“Los aceleradores AMD Instinct de la serie MI300 están diseñados con nuestras tecnologías más avanzadas, brindan un rendimiento líder y estarán en implementaciones empresariales y de nube a gran escala”, declara Victor Peng, presidente de AMD.

Este directivo  destaca el “enfoque de ecosistema abierto” para que “los proveedores de nube, OEM y ODM” puedan entregar “tecnologías que permiten a las empresas adoptar e implementar soluciones impulsadas por IA”.

Así, por ejemplo, Microsoft Azure ND MI300X v5 Virtual Machine funciona con MI300X, al igual que los servidores PowerEdge XE9680 de Dell.

Por su parte, el blade HPE Cray Supercomputing EX255a y el superordenador El Capitan del Laboratorio Nacional Lawrence Livermore están equipados con APUs MI300A.

Otro anuncio de AMD es la plataforma de software abierto AMD ROCm 6, que incrementa el rendimiento de aceleración de inteligencia artificial unas 8 veces con aceleradores de la serie MI300 en Llama 2 y que es compatible con FlashAttention, HIPGraph y vLLM.

Redacción Silicon

La redacción de Silicon está compuesta por profesionales del periodismo 2.0

Recent Posts

Silicon Pulse: Titulares de la semana T3E11

Bienvenido a un nuevo episodio del podcast semanal Silicon Pulse, un espacio en el que…

17 horas ago

Microsoft prioriza a España en su inversión mundial en infraestructura de IA

Asistimos al primer encuentro con los medios de Paco Salcedo como presidente de Microsoft España,…

19 horas ago

Kaspersky presenta su roadmap en el “Partner Kick Off” para 2025

Kaspersky presentó en León su estrategia de canal 2025, destacando el crecimiento en MSP/MSSP, la…

20 horas ago

DXC Technology crea en Girona un Centro de Excelencia en Sector Público

Respaldado por el centro de capacidades de DXC en Zaragoza, cuenta con más de un…

21 horas ago

EasyVista anuncia la versión 2025.1 de su plataforma

La solución de EasyVista aglutina gestión de servicios de TI y de dispositivos, monitorización de…

21 horas ago

Este año Microsoft formará gratis en IA a 1 millón de españoles

Los objetivos son democratizar el uso de una inteligencia artificial responsable e impulsar la competitividad…

22 horas ago