Una coalición de líderes en tecnología de centros de datos ha establecido el Grupo Promotor del Ultra Accelerator Link (UALink) para impulsar nuevos métodos de escalado de sistemas de IA en los centros de datos.
Unión de Jugadores Clave en la Industria
Empresas líderes como Advanced Micro Devices (AMD), Broadcom, Cisco, Google, Hewlett Packard Enterprise (HPE), Intel, Meta y Microsoft se han unido para desarrollar un estándar industrial que mejore la comunicación de alta velocidad y baja latencia para sistemas de IA en los centros de datos.
Presentando UALink
La iniciativa UALink busca crear un estándar abierto que permita a los aceleradores de IA comunicarse de manera más efectiva, facilitando una mejor integración, flexibilidad y escalabilidad en los centros de datos conectados a IA. Al establecer una interconexión basada en estándares abiertos, UALink beneficiará tanto a los fabricantes de equipos originales (OEM) como a profesionales de TI e integradores de sistemas.
Forrest Norrod, Gerente General del Grupo de Soluciones de Centros de Datos en AMD, destacó la importancia de esta colaboración: "Los esfuerzos de UALink para construir una infraestructura de aceleradores abierta y de alto rendimiento son cruciales para el futuro de la IA. Nuestra experiencia combinada impulsará los estándares abiertos y fortalecerá el ecosistema de IA."
Exclusiones Notables
Aunque el Grupo Promotor cuenta con amplia experiencia en IA a gran escala y computación de alto rendimiento, notablemente no incluye al líder de chips de IA, Nvidia.
Compromiso con Estándares Abiertos
Jas Tremblay, VP del Grupo de Soluciones de Centros de Datos en Broadcom, afirmó: "Como miembro fundador del Consorcio UALink, nuestro objetivo es promover la adopción de tecnología de IA a gran escala en los centros de datos. Apoyar un ecosistema abierto es vital para habilitar redes escalables con diversas soluciones de alta velocidad y baja latencia."
Escalando Cargas de Trabajo de IA de Manera Efectiva
A medida que aumentan las demandas computacionales de la IA, es imperativo establecer una red robusta y de baja latencia que integre fácilmente recursos de computación adicionales. El grupo UALink se propone estandarizar especificaciones para crear un entorno de alto rendimiento para cargas de trabajo de IA, maximizando los resultados de rendimiento.
El grupo planea desarrollar una especificación que optimice la interfaz para IA y Aprendizaje Automático, Computación de Alto Rendimiento (HPC) y aplicaciones en la Nube en futuros centros de datos de IA. Su objetivo es definir una interconexión de alta velocidad y baja latencia para una comunicación fluida entre aceleradores y conmutadores en los pods de computación de IA.
La futura especificación 1.0 tiene como objetivo habilitar conexiones para hasta 1,024 aceleradores en un solo pod de computación de IA, facilitando cargas y almacenamientos directos entre la memoria de los aceleradores, como las GPU.
Mirando Hacia el Futuro
El Grupo Promotor de UALink pronto establecerá el Consorcio UALink, que se anticipa se oficializará en el tercer trimestre de 2024, con la especificación 1.0 programada para seguir en el mismo período para los miembros del consorcio.
Acerca de UALink
El Ultra Accelerator Link (UALink) es una tecnología de interconexión de aceleradores de vanguardia diseñada para mejorar el rendimiento de clústeres de IA y Aprendizaje Automático de próxima generación. AMD, Broadcom, Cisco, Google, HPE, Intel, Meta y Microsoft están comprometidos con la creación de un organismo estándar abierto para desarrollar especificaciones técnicas que respalden un rendimiento innovador mientras fomentan un ecosistema abierto para aceleradores de centros de datos.
Martin Lund, EVP del Grupo de Hardware Común en Cisco, comentó: "A medida que crecen las cargas de trabajo de IA, las interconexiones de ultra alto rendimiento serán críticas. Nuestro objetivo compartido es crear UALink, una solución escalable y abierta que aborde los desafíos de construir supercomputadoras de IA."