Nvidia e Intel Establecen Nuevos Récords de Velocidad en el Entrenamiento de LLM en los Resultados de la Prueba MLPerf 3.1

Home Noticias de IA Nvidia e Intel Establecen Nuevos Récords de Velocidad en el Entrenamiento de LLM en los Resultados de la Prueba MLPerf 3.1

Updated on noviembre 8 2023

El entrenamiento de modelos de inteligencia artificial (IA) ha avanzado de manera significativa en 2023, según el último benchmark MLPerf Training 3.1. El ritmo de innovación en el sector de la IA generativa es asombroso, siendo el entrenamiento rápido de modelos un factor crucial en este progreso. El benchmark MLCommons MLPerf sigue y cuantifica esta eficiencia de entrenamiento. MLCommons es un consorcio de ingeniería abierto dedicado a mejorar los benchmarks de aprendizaje automático (ML), los conjuntos de datos y las mejores prácticas para fomentar el desarrollo de IA.

El benchmark MLPerf Training 3.1 incluyó aportaciones de 19 proveedores y generó más de 200 resultados de rendimiento. Esta ronda presentó benchmarks para el entrenamiento de grandes modelos de lenguaje (LLM), incluyendo GPT-3, e introdujo un nuevo benchmark para el modelo de generación de texto a imagen de código abierto Stable Diffusion. "Con más de 200 resultados de rendimiento, observamos mejoras sustanciales entre un 50% y casi 3 veces mejor," comentó David Kanter, director ejecutivo de MLCommons, durante una reciente conferencia de prensa.

Avances en el Entrenamiento de LLM que Superan la Ley de Moore

Un aspecto destacado de los benchmarks MLPerf Training 3.1 es el aumento significativo en el rendimiento del entrenamiento de LLM. Desde junio, cuando se incluyeron por primera vez datos de entrenamiento de LLM, los benchmarks MLPerf 3.1 muestran un aumento de casi 3 veces en el rendimiento de entrenamiento. "Al comparar el benchmark de entrenamiento de LLM más rápido de la primera ronda en junio con el último, hemos logrado un rendimiento aproximadamente 2.8 veces más rápido," señaló Kanter. "Aunque no puedo predecir las próximas rondas, esta mejora es impresionante y muestra capacidades increíbles."

Kanter cree que estos recientes aumentos de rendimiento en el entrenamiento de IA superan lo que la Ley de Moore sugeriría, que predice un aumento del doble en el rendimiento computacional cada pocos años. Afirmó que el sector de IA está escalando arquitectura de hardware y software a un ritmo superior a estas predicciones. "MLPerf actúa como un barómetro del progreso de la industria," agregó.

Avances Significativos de Líderes de la Industria

Intel, Nvidia y Google han realizado avances notables en los resultados de entrenamiento de LLM en los benchmarks MLPerf Training 3.1. Intel informó que su acelerador Habana Gaudi 2 logró un aumento del 103% en la velocidad de entrenamiento en comparación con los resultados de junio, utilizando técnicas como tipos de datos de punto flotante de 8 bits (FP8). "Habilitamos FP8 con la misma plataforma de software, mejorando nuestros resultados en hardware existente," dijo Itay Hubara, investigador sénior de Intel. "Cumplimos con nuestra última promesa de envío."

El Cloud TPU v5e de Google, lanzado el 29 de agosto, también demostró avances en el entrenamiento, aprovechando de manera similar FP8 para un rendimiento optimizado. Vaibhav Singh, gerente de producto de aceleradores en la nube en Google, habló sobre las capacidades de escalado logradas a través de la tecnología multislice de Cloud TPU. "Cloud TPU multislice escala de manera efectiva a través de la red del centro de datos," explicó Singh. "Con esta tecnología, logramos un rendimiento de escalado excepcional de hasta 1,024 nodos utilizando 4,096 chips TPU v5e."

El Superordenador EOS de Nvidia Impulsa el Entrenamiento de LLM

Nvidia maximizó la eficiencia de su entrenamiento de LLM utilizando su superordenador EOS, que se introdujo en las discusiones en 2022. Los resultados mostraron un aumento de 2.8 veces en la velocidad de entrenamiento para modelos GPT-3 en comparación con los benchmarks de junio. Dave Salvator, director de productos de computación acelerada en Nvidia, destacó que EOS está equipado con 10,752 GPUs conectadas a través de Nvidia Quantum-2 InfiniBand, operando a 400 gigabits por segundo, y 860 terabytes de memoria HBM3. "Las métricas de velocidad que estamos viendo son extraordinarias," comentó Salvator. "En términos de computación de IA, estamos superando los 40 exaflops, lo cual es notable."

En general, el benchmark MLPerf Training 3.1 subraya los rápidos avances en el entrenamiento de IA, marcando un momento crucial en la evolución de la inteligencia artificial.

Informe de Vanta: Cómo la gestión de confianza impulsada por IA puede cerrar las brechas de cumplimiento en seguridad

Comprendiendo los Últimos Anuncios de OpenAI: Implicaciones para Empresas del Sector Empresarial

Most people like

Slides Wizard

24.2K

Crea Presentaciones Impresionantes en Segundos En el mundo acelerado de hoy, la capacidad de generar presentaciones cautivadoras rápidamente es esencial para profesionales y estudiantes. Con herramientas innovadoras al alcance de tu mano, puedes diseñar diapositivas impactantes en cuestión de segundos, lo que te permite concentrarte en transmitir tu mensaje de manera efectiva. Ya sea que estés preparándote para una reunión de negocios, una conferencia académica o una presentación creativa, nuestro proceso simplificado te permite producir presentaciones de alta calidad sin esfuerzo. ¡Di adiós a horas de trabajo de diseño y hola a la perfección en presentaciones instantáneas!

presentación AI Presentation Generator

RunPod

616K

RunPod es una plataforma global líder en la nube, diseñada para la inferencia y el entrenamiento de IA, con un sólido soporte para GPU. Nuestro servicio permite a desarrolladores y científicos de datos aprovechar de manera eficiente la tecnología más avanzada, garantizando soluciones de aprendizaje automático rápidas y escalables. Experimenta un rendimiento sin interrupciones y una utilización óptima de los recursos con RunPod.

alquiler de GPU Other

Genspark.ai

1.1M

¡Explora la mejor guía de viajes y reseñas de productos! Nuestra plataforma está diseñada para aventureros y compradores astutos, ofreciendo información detallada sobre los principales destinos y productos imprescindibles. Ya sea que estés planificando tu próxima escapada o buscando el mejor equipo, te brindamos información confiable y reseñas de expertos para mejorar tu experiencia. ¡Únete a nosotros en el descubrimiento del mundo, una guía y reseña a la vez!

Guías de viaje AI Trip Planner

Doc2Lang

21.5K

Servicios de traducción de documentos rápidos y precisos para todas tus necesidades.

traducción de archivos de documentos AI Document Extraction

Find AI tools in YBX