NVIDIA, Arm e Intel proponen la especificación FP8 para inteligencia artificial
Tiene dos variantes (E5M2 y E4M3), ha sido publicada en formato abierto y funciona tanto para el entrenamiento como para la inferencia.
NVIDIA, Arm e Intel se alían en el campo de la inteligencia artificial para proponer un nuevo formato de intercambio.
“Tener un formato de intercambio común permitirá avances rápidos y la interoperabilidad de las plataformas de hardware y software para hacer avanzar la informática”, comentan sus impulsores, que han escrito un documento técnico al respecto y remitirán su propuesta al IEEE.
La protagonista de su colaboración es la especificación de coma flotante de 8 bits FP8, con la que ofrecen un formato para acelerar el desarrollo de inteligencia artificial optimizando el uso de memoria.
Esta especificación tiene dos variantes, E5M2 y E4M3, y funciona tanto para el entrenamiento como para la inferencia de inteligencia artificial.
NVIDIA, Arm e Intel han publicado FP8 en un formato abierto, sin licencia, para impulsar su adopción a lo largo de la industria. Ya ha sido implementado de forma nativa en la arquitectura NVIDIA Hopper.
FP8 minimizaría las desviaciones de formatos IEEE 754 existentes. En las pruebas realizadas ha mostrado una precisión comparable a formatos de 16 bits.