Ampere Computing Expande Família de CPUs e Foca em Eficiência em IA
A Ampere Computing anunciou que sua família de chips AmpereOne se expandirá para 256 núcleos até o próximo ano. A empresa também está colaborando com a Qualcomm para desenvolver aceleradores de IA em nuvem.
Segundo Jeff Wittich, Chief Product Officer, a nova Unidade Central de Processamento (CPU) oferecerá 40% mais desempenho do que qualquer outra CPU disponível atualmente.
Colaboração com a Qualcomm
Com sede em Santa Clara, Califórnia, a Ampere está se unindo à Qualcomm Technologies para criar uma solução para inferência de IA, aproveitando as soluções de inferência de alto desempenho e baixo consumo de energia da Qualcomm, juntamente com as CPUs da Ampere.
A CEO da Ampere, Renee James, enfatizou os desafios energéticos urgentes impostos pelos avanços em IA. "Iniciamos esta jornada há seis anos, pois reconhecemos sua importância," afirmou James. "Baixo consumo de energia não é mais sinônimo de baixo desempenho. A Ampere redefiniu a fronteira de eficiência da computação, oferecendo desempenho superior dentro de um modelo eficiente."
Abordagem à Eficiência Energética em Data Centers
O consumo de energia nos data centers é uma preocupação crescente. James destacou que a rápida adoção de IA intensificou os desafios energéticos da indústria. "A atual trajetória é insustentável. As infraestruturas de data centers futuras devem adaptar as configurações existentes refrigeradas a ar e construir novas instalações ambientalmente sustentáveis compatíveis com a disponibilidade de energia da rede," disse ela.
Wittich apoiou essa perspectiva, observando que a necessidade de uma nova CPU foi impulsionada pelo aumento do consumo de energia nos data centers, especialmente devido à IA. "É imperativo desenvolver soluções que melhorem a eficiência na computação em geral e em IA," acrescentou.
Visão da Ampere para Computação em IA
A Ampere está pioneirando uma abordagem abrangente chamada “Computação em IA”, que abrange capacidades nativas de nuvem e funcionalidades de IA. "Nossas CPUs podem suportar uma ampla gama de cargas de trabalho, desde aplicações populares nativas de nuvem até IA, integrando IA em aplicações tradicionais como processamento de dados e entrega de mídia," explicou Wittich.
Roteiro Futuro
A Ampere definiu um roteiro ambicioso para suas CPUs de data center. Entre os principais desenvolvimentos futuros está a CPU de 12 canais e 256 núcleos, fabricada com tecnologia TSMC N3. A CPU de 192 núcleos, anunciada anteriormente, já está em produção e disponível no mercado.
Ampere e Qualcomm estão colaborando para aprimorar sua solução conjunta com CPUs Ampere e Qualcomm Cloud AI 100 Ultra, visando a inferência de grandes modelos de linguagem (LLM) em IA generativa. Wittich descreveu a parceria como um compromisso em criar CPUs altamente eficientes otimizadas para aplicações de IA. "Essa solução facilitará a adoção pelos clientes e proporcionará capacidades inovadoras para a inferência de IA," comentou.
Aprimoramentos de Desempenho
Com a expansão da plataforma de 12 canais para incluir a nova CPU AmpereOne de 256 núcleos, os usuários podem esperar aumentos significativos de desempenho sem designs complicados. O modelo existente de 192 núcleos permanece programado para lançamento ainda este ano, mostrando uma evolução de oito para doze canais de memória.
Notavelmente, a tecnologia de CPU da Ampere já está sendo utilizada pelo Llama 3 da Meta na Oracle Cloud. O Llama 3 opera com a CPU Ampere Altra de 128 núcleos sem uma GPU, oferecendo paridade com a combinação de uma GPU Nvidia A10 e uma CPU x86, enquanto consome apenas um terço da energia.
Grupo de Trabalho UCIe e Vantagem Competitiva
Recentemente, a Ampere formou um grupo de trabalho UCIe como parte da AI Platform Alliance para aumentar a flexibilidade de suas CPUs, permitindo a integração de IP de clientes em projetos futuros.
A Ampere compete diretamente com a AMD, destacando suas vantagens de desempenho. As CPUs AmpereOne lideram em desempenho por watt, superando a Genoa da AMD em 50% e a Bergamo em 15%. Para data centers que buscam atualizar a infraestrutura, a AmpereOne pode fornecer 34% mais desempenho por rack.
As novas plataformas AmpereOne OEM e ODM estão programadas para serem enviadas nos próximos meses.
Além disso, a Ampere fez uma parceria com a NETINT para desenvolver uma solução usando seus chips de processamento de vídeo Quadra T1U, permitindo a transcodificação simultânea de 360 canais ao vivo e legendagem em tempo real para 40 streams, utilizando o modelo Whisper da OpenAI.
A Ampere visa ser a espinha dorsal da computação na era da IA. Recentes aprimoramentos, incluindo recursos como Marcação de Memória, Aplicação de QOS e Gerenciamento de Congestionamento de Mesh, culminam na introdução do recurso FlexSKU, permitindo que os clientes utilizem o mesmo SKU para casos de uso de escala para cima e para fora.
Ao colaborar com a Oracle, a Ampere conseguiu reduzir os custos operacionais em 28% enquanto utiliza apenas um terço da energia exigida pelas soluções concorrentes da Nvidia. Essa abordagem permite que os usuários operem com 15% menos servidores, 33% menos espaço em rack e 35% menos consumo de energia, alinhando-se ao compromisso da Ampere com eficiência e desempenho na computação em IA.