Préparez-vous à une ère de fluctuations imprévisibles des prix des GPU

Le rôle des GPU dans la révolution de l'IA

Les unités de traitement graphique (GPU) jouent un rôle clé dans la révolution de l'IA, alimentant de grands modèles de langage (LLM) qui soutiennent les chatbots et diverses applications d'IA. Avec les fluctuations de prix de ces puces, les entreprises doivent apprendre à naviguer dans les coûts variables de cette technologie essentielle.

Comprendre la volatilité des coûts

Des secteurs comme l'exploitation minière ont une expérience dans la gestion des coûts fluctuants, en équilibrant les sources d'énergie pour une disponibilité et des prix optimaux. De même, les entreprises de logistique s'adaptent aux variations folles des coûts d'expédition, influencées par des disruptions récentes dans des canaux de transport clés. Cependant, des secteurs comme les services financiers et les produits pharmaceutiques, qui manquent d'expérience en gestion de la volatilité des coûts, devront bientôt s'adapter. Ces secteurs peuvent tirer d'énormes bénéfices des avancées en IA, nécessitant une courbe d'apprentissage rapide.

La domination de Nvidia

Nvidia demeure le principal fournisseur de GPU, et sa valorisation a explosé cette année en raison d'une demande croissante. Les puces sont prisées pour leur capacité à traiter de nombreux calculs simultanément, les rendant essentielles pour l’entraînement et le déploiement des LLM. Notamment, certaines entreprises ont même eu recours à des véhicules blindés pour la livraison des puces H100 très demandées de Nvidia, soulignant ainsi leur importance.

Facteurs des fluctuations de coûts des GPU

La demande pour les GPU devrait augmenter de manière exponentielle, les sociétés d'investissement estimant que le marché pourrait dépasser 400 milliards de dollars dans cinq ans, alors que les entreprises s'empressent d'implémenter de nouvelles applications d'IA. Toutefois, l'offre est influencée par des facteurs imprévisibles tels que la capacité de production et les tensions géopolitiques, notamment dans des régions comme Taïwan, essentielles à la production de GPU. Les pénuries d'approvisionnement actuelles ont entraîné des délais d'attente prolongés pour les puces H100 de Nvidia, obligeant les entreprises à s'adapter à cette nouvelle réalité et à gérer efficacement les coûts variables.

Stratégies de gestion des coûts des GPU

Pour atténuer les fluctuations de coûts, les entreprises peuvent choisir de gérer leurs propres serveurs GPU plutôt que de compter sur des services de location de fournisseurs de cloud. Bien que cela entraîne des frais généraux supplémentaires, cette approche permet aux entreprises de mieux contrôler leurs coûts et peut conduire à des économies à long terme. Les entreprises pourraient également envisager d'acheter des GPU de manière défensive, garantissant un accès futur même lorsque leurs applications spécifiques demeurent incertaines.

Tous les GPU ne sont pas équivalents; les entreprises doivent sélectionner les types de GPU appropriés à leurs besoins spécifiques. Les GPU haute performance sont nécessaires pour les organisations formant de grands modèles fondamentaux, tels que GPT d'OpenAI, tandis que la plupart des entreprises bénéficieront de GPU de performance inférieure pour les tâches d'inférence à volume élevé. De plus, la localisation géographique joue un rôle crucial dans la gestion des coûts. Les régions avec une électricité abondante et bon marché, comme la Norvège, peuvent réduire considérablement les coûts opérationnels par rapport à des zones comme l'est des États-Unis, avec des prix énergétiques plus élevés. Les DSI doivent évaluer l'équilibre entre coût et qualité dans les applications d'IA, en exploitant potentiellement moins de puissance de calcul pour des projets nécessitant une précision inférieure.

Optimisation des coûts grâce à la flexibilité

Les organisations peuvent réduire davantage les coûts en passant d'un fournisseur de cloud à un autre et en adoptant différents modèles d'IA, à l'instar de la manière dont les entreprises de logistique optimisent leurs méthodes de transport. Les technologies améliorant l'efficacité des opérations LLM pour diverses applications contribueront également à la gestion des coûts.

Défis de la prévision de la demande

L'évolution rapide de la technologie IA complique la prévision de la demande pour les GPU. De nouvelles architectures LLM émergent, comme le design "Mixture-of-Experts" de Mistral, qui conserve l'utilisation des puces en activant uniquement les parties nécessaires du modèle pour des tâches spécifiques. Parallèlement, des applications innovantes évoluent, rendant les prévisions de demande encore plus difficiles pour la plupart des entreprises.

Préparation aux coûts futurs

Le paysage de l'IA se développe, avec des prévisions indiquant une croissance annuelle de 19 % des revenus pour les secteurs liés à l'IA, atteignant 900 milliards de dollars d'ici 2026. Bien que cette tendance offre des opportunités pour des producteurs comme Nvidia, elle exige également des entreprises qu'elles adoptent de nouvelles stratégies de gestion des coûts. Les organisations doivent commencer à se préparer à ce changement dès aujourd'hui.

Florian Douetteau est le PDG et co-fondateur de Dataiku.

Most people like

Find AI tools in YBX