A Intel apresentou seu novo chip de processamento de IA de última geração, o acelerador de IA Gaudi 3, projetado para aprimorar o desenvolvimento de IA, simplificando fluxos de trabalho, infraestrutura e acelerando cargas de trabalho empresariais.
O Gaudi 3 mantém a arquitetura de seu antecessor, mas oferece desempenho significativamente melhorado—quatro vezes mais poder computacional, o dobro da largura de banda de rede e 1,5 vezes a capacidade de memória de alta largura de banda (HBM), permitindo gerenciar as crescentes demandas de grandes modelos de linguagem (LLMs) sem comprometer o desempenho.
Com raízes na tecnologia de unidades de processamento gráfico (GPU), as capacidades de processamento paralelo e a arquitetura multi-tile do Gaudi 3 o tornam ideal como um acelerador de IA. Este lançamento faz parte da estratégia da Intel para competir com a Nvidia e a AMD no mercado de aceleradores de IA.
O CEO da Intel, Patrick Gelsinger, apresentou o Gaudi 3 no evento AI Everywhere e anunciou que, embora o chip seja oficialmente lançado hoje, a disponibilidade geral está prevista para o terceiro trimestre de 2024, com alguns clientes recebendo amostras antes disso.
Segundo Jeni Barovian, vice-presidente de soluções de IA para data centers da Intel, “A IA generativa representa uma transformação fundamental na computação.” Ela enfatizou que o Gaudi 3 oferecerá o desempenho, escalabilidade e eficiência necessários para construir os futuros sistemas de IA.
Intel Gaudi 3: Especificações e Desempenho
Eitan Medina, COO da Habana Labs da Intel, descreve o Gaudi 3 como apresentando uma arquitetura de computação heterogênea que inclui 64 núcleos de processamento Tensor (5ª geração), 8 Motores de Matemática Matricial, 128 GB de capacidade HBM com largura de banda de 3,7 TB/s, e 24 portas Ethernet RoCE de 200 GbE.
Construir soluções com o Gaudi 3 é tão simples quanto com o Gaudi 2. A Intel dobrou a largura de banda de rede por acelerador, permitindo configurações extensas de cluster baseadas nas necessidades da carga de trabalho—seja inferência, ajuste fino ou treinamento.
Comparação com GPUs da Nvidia
Em comparação com a H100 da Nvidia—uma GPU líder para treinamento de grandes modelos de linguagem como Llama 2 e GPT-3—espera-se que o Gaudi 3 seja até 1,7 vezes mais rápido em tarefas de treinamento. Em testes de inferência utilizando modelos como Llama-7B e Falcon 180B, o Gaudi 3 demonstrou desempenho 1,5 vezes superior ao da H100 e 1,3 vezes mais rápido que a mais nova H200. Notavelmente, o Gaudi 3 apresenta uma taxa de eficiência energética até 2,3 vezes maior que a H100 em tarefas de inferência.
Ampla Linha de Produtos
A Intel não está apenas lançando o chip Gaudi 3, mas também três produtos complementares:
1. Gaudi 3 AI Accelerator Card (HL-325L): Compatível com OAM, com 1.835 TFLOPs e 128 GB de HBM2e.
2. Universal Baseboard (HLB-325): Oferece 14,6 PFLOPS e mais de 1 TB de HBM2e.
3. PCI Express Add-in Card: Possui um design de resfriamento passivo de slot duplo, com métricas de desempenho comparáveis aos concorrentes.
O Futuro da IA nas Empresas
O Gaudi 3 da Intel aborda preocupações em nível empresarial, com Sachin Katti, VP sênior do grupo de rede e edge, afirmando que estamos entrando em uma era de agentes de IA que podem lidar autonomamente com fluxos de trabalho complexos. A próxima fase da IA verá esses agentes aproveitando dados proprietários, preparando o terreno para uma transformação significativa em diversas indústrias.
Katti destaca o desafio de integrar dados proprietários e não estruturados em sistemas de IA, que muitas vezes permanecem dependentes de CPU e dispersos em vários formatos. Ele defende um ecossistema modular e seguro onde as empresas possam escolher entre uma variedade de soluções de IA compatíveis, com foco na implantação responsável para garantir confiabilidade e mitigar preconceitos.
A Intel busca aproveitar as capacidades aprimoradas do Gaudi para atrair clientes que estão no ecossistema da Nvidia, especialmente à medida que os custos de IA aumentam. Com o mercado de chips de IA projetado para crescer substancialmente, a Intel está se posicionando como uma alternativa viável, enfatizando uma abordagem aberta e colaborativa para soluções de IA.
Conclusão
À medida que a IA generativa marca um momento crucial na computação, o Gaudi 3 da Intel introduz desempenho e eficiência competitivos, visando transformar a implantação de IA nas empresas. O compromisso da empresa com padrões abertos e compatibilidade de sistemas destaca sua dedicação em apoiar o panorama em evolução da IA, prometendo atender às necessidades de diversas empresas que buscam aproveitar o poder da IA.