Dentro de Intel Larrabee

El procesador Intel Larrabee es el primer chip multinúcleo de Intel capacitado para abordar la generación de gráficos. Larrabee representa también una amenaza para los fabricantes de procesadores gráficos NVIDIA y AMD.

intellarrabee.jpg

Las poderosas soluciones gráficas de estos dos fabricantes comienzan a ser coaccionadas por los chips de silicio del rey de Silicon Valley. Intel Larrabee tendrá numerosos núcleos x86 (Intel no quiere revelar cuántos) y soportará OpenGL y DirectX, lo que le permitirá ejecutar los juegos existentes y aquellas aplicaciones que requieren hardware gráfico de alto nivel.

Convergencia CPU-GPU
Intel defiende que Larrabee aúna el rendimiento de una CPU y una GPU (Graphical Processing Unit). Impulsadas por la necesidad de alcanzar la máxima productividad, las CPUs incorporan cada vez más núcleos y tienen más potencia. Del mismo modo, a causa de la necesidad de generar gráficos cada vez con mayor calidad y de afrontar la programación de aplicaciones dotadas de un elevado nivel de paralelismo, las GPUs están siendo forzadas a realizar más tareas de propósito general.

Diferencias clave entre Larrabee y las GPUs convencionales
Cada núcleo Larrabee es un core x86 completamente funcional que contempla cambios de contexto y multitarea preferente; memoria virtual e intercambio de páginas; memorias caché con múltiples niveles de jerarquía, etc.
Comunicación eficiente entre bloques funcionales: bus en anillo para una comunicación plena entre núcleos; baja latencia, elevado ancho de banda para las cachés de nivel 1 y 2; sincronización rápida entre los núcleos y las cachés. La presencia de una lógica con funciones fijas no representa un óbice. Entre otras ventajas, la ausencia de lógica de rasterización entre los sombreadores de vértices y píxeles redunda en un reparto de la carga de trabajo y una funcionalidad general más flexibles.

Diagrama de bloques funcionales del procesador Larrabee
Los núcleos se comunican entre ellos empleando un bus en anillo, lo que asegura un acceso rápido a la memoria y bloques con funciones fijas, así como un acceso veloz que permite mantener la coherencia de la memoria caché. La caché L2 está repartida entre todos los núcleos, lo que proporciona un elevado ancho de banda y permite compartir y replicar los datos.

Diagrama de bloques funcionales del chip Larrabee x86
Unidades vectoriales y escalares independientes con registros propios; núcleo x86 escalar; unidad vectorial 16 operaciones/ciclo de reloj de 32 bits; cauce de ejecución corto; acceso rápido desde la caché L1; conexión directa entre cada conjunto de núcleos y la caché L2; precarga de instrucciones en las cachés L1 y L2.