A Nvidia se tornou recentemente a empresa mais valiosa do mundo, gerando receitas significativas com suas GPUs de alta demanda, que apresentam preços elevados devido à escassez de recursos e à dinâmica de mercado. Essa situação levanta questões cruciais: “Como garantiremos a receita necessária para adquirir as GPUs e quais recursos são necessários para suportar nossas cargas de trabalho?”
O CEO da Nvidia, Jensen Huang, atualmente a 11ª pessoa mais rica do mundo, expressa preocupações de que muitos clientes carecem dos data centers e da energia necessários para aproveitar ao máximo os chips adquiridos. A empresa continua a regular as alocações de chips para evitar o acúmulo, diante da oferta limitada. Essa situação gerou tensões com a Microsoft, que não está satisfeita com a influência da Nvidia sobre a forma como Integra GPUs em seus data centers.
Em resposta às pressões do mercado, o CEO da Dell, Michael Dell, anunciou uma parceria com a Nvidia para criar uma nova fábrica de IA para a startup de Elon Musk, xAI. Essa iniciativa também visa ajudar empresas na construção de data centers. Além disso, a Hewlett Packard Enterprise (HPE) firmou parceria com a Nvidia para oferecer soluções de IA em nuvem privada turnkey.
Os custos crescentes associados à escalabilidade da infraestrutura são agora um tema central, especialmente à luz das atuais Chip Wars e das dificuldades em garantir poder computacional. Esses custos crescentes impedirão o potencial da IA? Esta questão crucial será explorada durante o Transform 2024, ao vivo em San Francisco. Líderes do setor discutirão o cenário atual e suas implicações para as empresas, além de tecnologias alternativas que estão ganhando destaque.
Os palestrantes principais incluem Kirk Bresniker, Arquiteto Chefe da Hewlett Packard Labs; Dr. Jamie Garcia, Diretor de Algoritmos Quânticos e Parcerias da IBM; e Paul Roberts, Diretor de Contas Estratégicas da AWS. Eles discutirão a corrida para escalar cargas de trabalho de IA enquanto gerenciam os custos da infraestrutura, o surgimento de provedores alternativos focados em melhorar o desempenho das cargas de trabalho de IA e a redução de custos e impacto ambiental.
Participe do VB Transform 2024, que ocorrerá ao vivo em San Francisco, de 9 a 11 de julho. O evento focará na escalabilidade eficaz da IA, apresentando estudos de caso práticos de IA generativa e insights de líderes do setor.