Ya está disponible la serie AMD Instinct MI300

AMD ya tiene lista y disponible en el mercado una nueva familia de aceleradores AMD Instinct MI300.

Se trata de los AMD Instinct MI300X, que prometen mejorías en ancho de banda de memoria para inteligencia artificial generativa, con un máximo de 5,3 TB/s.

Estos aceleradores funcionan con la arquitectura AMD CDNA 3. Cuentan con 192 GB de capacidad de memoria HBM3 y potencian el rendimiento para el entrenamiento y la inferencia de modelos de lenguaje grandes.

En comparación con los anteriores MI250X, ofrecen 1,5 veces más capacidad de memoria, 1,7 veces más ancho de banda de memoria teórica máxima y alrededor de un 40 % más de unidades de cómputo. También introducen soporte para FP8 y sparsity.

AMD ha presentado también la unidad de procesamiento acelerado Instinct MI300A con GPU CDNA 3 y CPU Zen 4.

Esta APU de centro de datos para computación de alto rendimiento e inteligencia artificial, aprovecha la arquitectura AMD Infinity de cuarta generación. Con 128 GB de memoria HBM3, ofrece casi el doble de rendimiento por vatio en cargas de trabajo que MI250X.

“Los aceleradores AMD Instinct de la serie MI300 están diseñados con nuestras tecnologías más avanzadas, brindan un rendimiento líder y estarán en implementaciones empresariales y de nube a gran escala”, declara Victor Peng, presidente de AMD.

Este directivo  destaca el “enfoque de ecosistema abierto” para que “los proveedores de nube, OEM y ODM” puedan entregar “tecnologías que permiten a las empresas adoptar e implementar soluciones impulsadas por IA”.

Así, por ejemplo, Microsoft Azure ND MI300X v5 Virtual Machine funciona con MI300X, al igual que los servidores PowerEdge XE9680 de Dell.

Por su parte, el blade HPE Cray Supercomputing EX255a y el superordenador El Capitan del Laboratorio Nacional Lawrence Livermore están equipados con APUs MI300A.

Otro anuncio de AMD es la plataforma de software abierto AMD ROCm 6, que incrementa el rendimiento de aceleración de inteligencia artificial unas 8 veces con aceleradores de la serie MI300 en Llama 2 y que es compatible con FlashAttention, HIPGraph y vLLM.

Redacción Silicon

La redacción de Silicon está compuesta por profesionales del periodismo 2.0

Recent Posts

Salesforce lanza Agentforce 2.0: la plataforma de trabajo digital impulsada por agentes de IA autónomos

Salesforce presenta Agentforce 2.0, la plataforma digital que transforma el trabajo empresarial con agentes de…

3 horas ago

@aslan prepara un plan de divulgación sobre tendencias tecnológicas para 2025

Estas tendencias giran en torno a la resiliencia de los datos, la ciberseguridad, el puesto…

3 horas ago

Linda, de Bewe software, una asistente de IA para optimizar pymes en LATAM y España

Linda, el innovador asistente de IA desarrollado por Bewe Software, ha sido galardonado como Caso…

4 horas ago

Sandisk renueva su identidad corporativa

Bajo el lema Mindset of Motion, defiende que las personas puedan experimentar el potencial de…

5 horas ago

El próximo smartphone de OnePlus ya tiene fecha de salida: el 7 de enero

Será el primer terminal OnePlus con doble certificación IP68 e IP69.

5 horas ago

Mate X6, el nuevo móvil plegable de HUAWEI

HUAWEI introduce también la serie de teléfonos móviles Nova 13 y los auriculares FreeClip y…

6 horas ago