Intel ha presentado su nuevo chip de procesamiento de IA de próxima generación, el acelerador de IA Gaudi 3, diseñado para mejorar el desarrollo de IA mediante la optimización de flujos de trabajo, la simplificación de la infraestructura y la aceleración de las cargas de trabajo empresariales.
El Gaudi 3 mantiene la arquitectura de su predecesor, pero ofrece un rendimiento significativamente mejorado: cuatro veces más potencia de cálculo, el doble de ancho de banda de red y 1.5 veces la capacidad de memoria de ancho de banda alto (HBM), lo que le permite gestionar las crecientes demandas de los modelos de lenguaje grande (LLMs) sin comprometer el rendimiento.
Con base en la tecnología de unidades de procesamiento gráfico (GPU), las capacidades de procesamiento paralelo y la arquitectura multi-tile del Gaudi 3 lo convierten en un excelente acelerador de IA. Este lanzamiento forma parte de la estrategia de Intel para competir con Nvidia y AMD en el mercado de aceleradores de IA.
El CEO de Intel, Patrick Gelsinger, presentó el Gaudi 3 en el evento AI Everywhere y anunció que, aunque el chip se lanza oficialmente hoy, su disponibilidad general está programada para el tercer trimestre de 2024, con algunos clientes ya recibiendo muestras.
Según Jeni Barovian, vicepresidenta de soluciones de IA para centros de datos de Intel, “la IA generativa representa una transformación fundamental de la computación”. Destacó que el Gaudi 3 proporcionará el rendimiento, la escalabilidad y la eficiencia necesarias para construir sistemas de IA del futuro.
Intel Gaudi 3: Especificaciones y Rendimiento
Eitan Medina, COO de Habana Labs de Intel, describe al Gaudi 3 como un chip con arquitectura de computación heterogénea que incluye 64 núcleos de procesador Tensor (quinta generación), 8 motores de cálculo de matrices, 128 GB de capacidad de HBM con ancho de banda de 3.7 TB/s y 24 puertos Ethernet RoCE de 200 GbE.
Crear soluciones con el Gaudi 3 es igual de sencillo que con el Gaudi 2. Intel ha duplicado el ancho de banda de la red por acelerador, permitiendo configuraciones de clúster extensas basadas en las necesidades de carga de trabajo, ya sea para inferencia, ajuste fino o entrenamiento.
Comparación con GPUs de Nvidia
En comparación con la H100 de Nvidia, un GPU líder para entrenar modelos de lenguaje grande como Llama 2 y GPT-3, se proyecta que el Gaudi 3 sea hasta 1.7 veces más rápido en tareas de entrenamiento. En pruebas de inferencia utilizando modelos como Llama-7B y Falcon 180B, se informa que el Gaudi 3 es 1.5 veces más rápido que la H100 y 1.3 veces más rápido que la nueva H200. También destaca la eficiencia energética del Gaudi 3, que puede ser hasta 2.3 veces mayor que la de la H100 en tareas de inferencia.
Amplia Línea de Productos
Además del chip Gaudi 3, Intel lanza tres productos complementarios:
1. Tarjeta Aceleradora de IA Gaudi 3 (HL-325L): Conformidad OAM, 1,835 TFLOPs y 128 GB HBM2e.
2. Base Universal (HLB-325): Ofrece 14.6 PFLOPS y más de 1 TB HBM2e.
3. Tarjeta de Adición PCI Express: Diseño de refrigeración pasiva de doble ranura, con métricas de rendimiento comparables a sus contrapartes.
El Futuro de la IA en las Empresas
El Gaudi 3 de Intel aborda preocupaciones a nivel empresarial, con Sachin Katti, vicepresidente sénior del grupo de red y edge, afirmando que estamos entrando en una era de agentes de IA capaces de manejar flujos de trabajo complejos de forma autónoma. La próxima fase de la IA verá a estos agentes aprovechar datos propietarios, preparando el camino para una transformación significativa en diversas industrias.
Katti destaca el desafío de integrar datos no estructurados y propietarios en sistemas de IA, que a menudo dependen de CPUs y están dispersos en diferentes formatos. Aboga por un ecosistema modular y seguro donde las empresas puedan elegir entre una variedad de soluciones de IA compatibles, centradas en un despliegue responsable para asegurar confiabilidad y mitigar sesgos.
Intel busca aprovechar las capacidades mejoradas de Gaudi para atraer clientes alejados del ecosistema de Nvidia, especialmente a medida que aumentan los costos de IA. Con una proyección de crecimiento significativo en el mercado de chips de IA, Intel se posiciona como una alternativa viable, enfatizando su enfoque abierto y colaborativo en soluciones de IA.
Conclusión
A medida que la IA generativa marca un momento crucial en la computación, el Gaudi 3 de Intel introduce un rendimiento y eficiencia competitivos orientados a transformar el despliegue de IA en las empresas. El compromiso de la empresa con estándares abiertos y compatibilidad de sistemas resalta su dedicación a apoyar el paisaje cambiante de la IA, prometiendo satisfacer las necesidades de diversas empresas que buscan aprovechar el poder de la IA.