Nvidia est récemment devenu la société la plus précieuse au monde, générant des revenus considérables grâce à ses GPU très recherchés, qui se vendent à des prix premium en raison de la rareté des ressources et des dynamiques de marché. Cette situation soulève des questions cruciales : « Comment assurer le revenu nécessaire pour acquérir les GPU, et quelles ressources sont requises pour soutenir nos charges de travail ? »
Le PDG de Nvidia, Jensen Huang, désormais la 11e personne la plus riche au monde, s'inquiète du fait que de nombreux clients ne disposent pas des centres de données et de l'énergie nécessaires pour tirer pleinement parti des puces qu'ils ont achetées. L'entreprise continue de réguler l'attribution des puces afin d'éviter le stockage excessif, dans un contexte de fourniture limitée. Cela a créé des tensions avec Microsoft, mécontent de l'influence de Nvidia sur l'intégration des GPU dans ses centres de données.
Face aux pressions du marché, le PDG de Dell, Michael Dell, a annoncé un partenariat avec Nvidia visant à créer une nouvelle usine d'IA pour la startup d’Elon Musk, xAI. Cette initiative vise également à aider les entreprises à construire des centres de données. De plus, Hewlett Packard Enterprise (HPE) s'est associé à Nvidia pour offrir des solutions d'IA en cloud privé clés en main.
Les coûts croissants liés à l'expansion des infrastructures sont désormais un sujet brûlant, surtout à la lumière des conflits liés aux semi-conducteurs et des défis pour sécuriser la puissance de calcul. Les coûts croissants des infrastructures vont-ils freiner le potentiel de l'IA ? Cette question cruciale sera explorée lors de Transform 2024, en direct à San Francisco. Les leaders du secteur examineront le paysage actuel et ses implications pour les entreprises, ainsi que les technologies alternatives qui gagnent en popularité.
Parmi les intervenants clés figurent Kirk Bresniker, Architecte en chef chez Hewlett Packard Labs ; Dr. Jamie Garcia, Directeur des Algorithmes Quantiques et des Partenariats chez IBM ; et Paul Roberts, Directeur des Comptes Stratégiques chez AWS. Ils discuteront de la course à l'échelle des charges de travail en IA tout en gérant les coûts d'infrastructure, de la montée de fournisseurs alternatifs visant à améliorer la performance des charges de travail en IA, ainsi que de la réduction des coûts et de l'impact environnemental.
Rejoignez-nous à VB Transform 2024, qui se tiendra en direct à San Francisco du 9 au 11 juillet. L'événement mettra l'accent sur l'expansion efficace de l'IA, avec des études de cas pratiques sur l'IA générative et des perceptions d'experts du secteur.