IBM Cloud anunció que su plataforma contará los chips Intel Gaudi 3, en las regiones de Frankfurt y Washington D.C., junto con una activación en Texas, USA, para el segundo semestre de 2025.
Con los Intel Gaudi 3, IBM busca planta cara a la exigente carga de cómputos en IA, optimizando los procesos.
Recordemos que los Gaudi 3 fueron presentados por Intel en abril del año pasado, y que tienen la capacidad de triplicar el cómputo para IA FP8, cuatro veces para BF16 y 1.5 veces más el ancho de banda con la versión anterior del chip.

Al compararlo con el NVIDIA H100, mejora en promedio un 50 % la inferencia en modelos como Llama2 de Meta y GPT-3 de OpenAI, a un costo menor.
Saurabh Kulkarni, vicepresidente de estrategia de IA para centros de datos y gestión de productos de Intel, afirmó:
“Al incorporar los aceleradores de IA Intel Gaudi 3 a IBM Cloud, permitimos a las empresas escalar cargas de trabajo de IA generativa con un rendimiento optimizado para la inferencia y el ajuste preciso. Esta colaboración subraya nuestro compromiso compartido de hacer que la IA sea más accesible y rentable para las empresas de todo el mundo”.

Los chips están disponibles para instancias VPC en IBM Cloud Virtual Servers y, próximamente, en clústeres de Red Hat OpenShift.
Steven Huels, vicepresidente de Ingeniería de IA de Red Hat, destacó:
“Combinar el poder de Red Hat AI con los aceleradores de IA Intel Gaudi 3 en IBM Cloud ofrece a las organizaciones una vía clara para acelerar sus planes de IA. En Red Hat nos complace aprovechar nuestra larga colaboración con IBM e Intel para ofrecer soluciones integrales de IA de código abierto que ayuden a las organizaciones a aprovechar al máximo el valor de la IA y la IA generativa”.