Ampere amplía su CPU a 256 núcleos y colabora con Qualcomm para soluciones avanzadas de inteligencia artificial en la nube.

Ampere Computing Amplía Su Familia de CPUs y se Enfoca en la Eficiencia en IA

Ampere Computing ha anunciado que su familia de chips AmpereOne se expandirá a 256 núcleos para el próximo año. Además, la empresa colabora con Qualcomm para desarrollar aceleradores de IA en la nube.

Según Jeff Wittich, Director de Producto, la nueva unidad de procesamiento central (CPU) ofrecerá un 40% más de rendimiento que cualquier otra CPU disponible hoy en día.

Colaboración con Qualcomm

Con sede en Santa Clara, California, Ampere se asociará con Qualcomm Technologies para crear una solución para la inferencia de IA aprovechando las soluciones de inferencia Cloud AI 100 de Qualcomm, de alto rendimiento y bajo consumo, junto a las CPUs de Ampere.

La CEO de Ampere, Renee James, enfatizó los desafíos energéticos apremiantes que plantean los avances en IA: “Iniciamos este camino hace seis años al reconocer su importancia. La baja potencia ya no equivale a bajo rendimiento. Ampere ha redefinido la frontera de eficiencia de la computación, ofreciendo un rendimiento superior dentro de un marco eficiente.”

Abordando la Eficiencia Energética en Centros de Datos

El consumo energético de los centros de datos es una preocupación creciente. James destacó que la rápida adopción de IA ha intensificado los desafíos energéticos de la industria: “La trayectoria actual no es sostenible. Las infraestructuras futuras de los centros de datos deben adaptar los sistemas existentes de refrigeración por aire y construir nuevas instalaciones ambientalmente sostenibles compatibles con la disponibilidad de energía de la red,” afirmó.

Wittich respaldó esta perspectiva, mencionando que la necesidad de una nueva CPU se debe al aumento del consumo energético en los centros de datos, especialmente por IA. “Es imperativo que desarrollemos soluciones que mejoren la eficiencia en la computación general y en IA,” añadió Wittich.

La Visión de Ampere para la Computación en IA

Ampere está liderando un enfoque integral denominado “Computación en IA”, que abarca capacidades nativas de la nube y funcionalidad de IA. “Nuestras CPUs pueden soportar una amplia gama de cargas de trabajo, desde aplicaciones nativas de la nube hasta IA, integrando IA en aplicaciones tradicionales como el procesamiento de datos y la entrega de medios,” explicó Wittich.

Hoja de Ruta Futura

Ampere ha establecido una hoja de ruta ambiciosa para sus CPU de centros de datos. Los próximos desarrollos clave incluyen la CPU de 256 núcleos y 12 canales, fabricada con tecnología TSMC N3. La CPU de 192 núcleos, anunciada anteriormente, ya está en producción y disponible en el mercado.

Ampere y Qualcomm están colaborando para mejorar su solución conjunta que incluye CPUs de Ampere y Qualcomm Cloud AI 100 Ultra, enfocándose en la inferencia de modelos de lenguaje grande (LLM) en IA generativa.

Wittich describió su asociación como un compromiso para crear CPUs altamente eficientes optimizadas para aplicaciones de IA. “Esta solución simplificará la adopción por parte de los clientes y ofrecerá capacidades innovadoras para la inferencia de IA,” comentó.

Mejoras en el Rendimiento

Con la expansión de la plataforma de 12 canales para incluir la nueva CPU AmpereOne de 256 núcleos, los usuarios pueden esperar aumentos significativos en el rendimiento sin diseños complicados. El modelo de 192 núcleos existente sigue programado para lanzarse más adelante este año, mostrando una evolución de ocho a doce canales de memoria.

Cabe destacar que la tecnología de CPU de Ampere ya está siendo utilizada por Llama 3 de Meta en Oracle Cloud. De manera notable, Llama 3 funciona en la CPU Ampere Altra de 128 núcleos sin GPU, ofreciendo paridad con una combinación de GPU Nvidia A10 y CPU x86, consumiendo solo un tercio de la energía.

Grupo de Trabajo UCIe y Ventaja Competitiva

Recientemente, Ampere formó un grupo de trabajo UCIe como parte de la Alianza de Plataformas de IA para mejorar la flexibilidad de sus CPUs, permitiendo la integración de propiedad intelectual del cliente en futuros diseños.

Ampere compite directamente con AMD, destacando sus ventajas de rendimiento. Las CPUs AmpereOne lideran en rendimiento por vatio, superando las de AMD, Genoa, en un 50% y Bergamo en un 15%. Para centros de datos que buscan actualizar su infraestructura, AmpereOne puede ofrecer un 34% más de rendimiento por rack.

Las nuevas plataformas OEM y ODM de Ampere están programadas para ser enviadas en los próximos meses.

Además, Ampere se ha asociado con NETINT para desarrollar una solución utilizando sus chips de procesamiento de video Quadra T1U, que permite la transcodificación simultánea de 360 canales en vivo y subtítulos en tiempo real para 40 flujos, utilizando el modelo Whisper de OpenAI.

Ampere aspira a ser la columna vertebral de la computación en la era de la IA. Las recientes mejoras, incluyendo características como Etiquetado de Memoria, Aplicación de QOS y Gestión de Congestión de Malla, culminan con la introducción de la función FlexSKU, permitiendo a los clientes aprovechar el mismo SKU tanto para casos de uso de escalado horizontal como vertical.

Al colaborar con Oracle, Ampere ha logrado reducir los costos operativos en un 28% utilizando solo un tercio de la energía requerida por soluciones competidoras de Nvidia. Este enfoque permite a los usuarios operar con un 15% menos de servidores, un 33% menos de espacio en rack y un 35% menos de consumo energético, alineándose con el compromiso de Ampere con la eficiencia y el rendimiento en la computación de IA.

Most people like

Find AI tools in YBX