La demande croissante pour les GPU Nvidia, qui a captivé l'attention de la Silicon Valley l'été dernier, s'est transformée en une opportunité lucrative au sein de l'industrie de l'IA. Par exemple, Lambda, une société de cloud GPU utilisant la technologie Nvidia, a récemment annoncé une nouvelle levée de fonds de 320 millions de dollars, avec une valorisation atteignant 1,5 milliard de dollars. Ce financement permettra d'élargir ses services de cloud AI.
Dans une actualité connexe, Salesforce a investi dans Together AI, qui est désormais valorisée à plus d'un milliard de dollars, selon un récent rapport de The Information. De plus, en décembre 2023, le fournisseur de cloud GPU CoreWeave a réalisé une valorisation impressionnante de 7 milliards de dollars après un investissement minoritaire de 642 millions de dollars dirigé par Fidelity Management and Research Co.
L'action de Nvidia a triplé alors que les startups d'IA se battent pour accéder à ses GPU. Il y a un an, des experts identifiaient Nvidia, qui domine plus de 80 % du marché des puces AI haut de gamme, comme un acteur clé prêt à profiter du secteur florissant de l'IA générative. Récemment, sa capitalisation boursière a dépassé celle d'Amazon et d'Alphabet.
Les startups sont de plus en plus en quête des coûteux GPU H100 de Nvidia, essentiels pour entraîner de grands modèles de langage (LLMs). L'investisseur et ancien PDG de GitHub, Nat Friedman, a révélé la création d'une plateforme ressemblant à Craigslist pour les clusters GPU, proposant des annonces telles que « 32 H100 disponibles du 14/02/2024 au 31/03/2024 ».
De plus, Forbes a rapporté que Friedman et son partenaire Daniel Gross ont développé leur propre superordinateur, le Cluster Andromeda, qui comprend plus de 4 000 GPU. Ils proposent ces ressources informatiques aux entreprises de leur portefeuille à des tarifs inférieurs au marché.
Friedman a partagé qu'il est devenu essentiellement un courtier en puces informatiques pour les entreprises émergentes de l'IA, déclarant : « Il y a eu des semaines où je passais la majeure partie de mon temps à trouver des GPU pour les gens. Demander aux fondateurs ce dont ils avaient besoin est devenu la priorité numéro un. »
Face à cette demande de GPU, le PDG d'OpenAI, Sam Altman, a suggéré un projet transformateur visant à redéfinir le paysage des puces IA, dont le coût pourrait atteindre des trillions, influencé par des facteurs géopolitiques.
Cependant, tout le monde n'est pas d'accord avec cette approche. Le PDG de Databricks, Ali Ghodsi, prévoit une baisse significative des prix des puces IA et un réalignement de l'offre et de la demande dans l'année à venir. Il a comparé la situation aux préoccupations passées concernant la bande passante Internet, prédisant une résolution similaire pour les pénuries de GPU.
La question pressante demeure : ce changement se produira-t-il suffisamment tôt pour soulager la pénurie de GPU à laquelle font face les startups d'IA ?