Depuis des années, Nvidia est synonyme d’unités de traitement graphique (GPU) haut de gamme qui alimentent les avancées dans les domaines des jeux, de la science des données et maintenant de l’intelligence artificielle. Mais les récentes initiatives de l’entreprise révèlent une volonté croissante de répondre aux besoins d’un marché plus large de l’IA, dans lequel toutes les applications ne nécessitent pas le matériel le plus avancé et le plus coûteux.
Au-delà des GPU : Diversifier les solutions de calcul
Nvidia ne vend plus seulement des GPU. Les investissements récents dans la technologie des puces à faible latence et l’introduction de processeurs autonomes témoignent d’une stratégie visant à attirer les clients qui privilégient l’efficacité à la puissance brute. Ceci est particulièrement pertinent pour « l’IA agentique » – des logiciels nécessitant une réactivité en temps réel plutôt que des ensembles de données de formation massifs.
Ce changement s’est consolidé avec l’annonce hier d’un accord de plusieurs milliards de dollars entre Nvidia et Meta. Le géant des médias sociaux achètera un mélange de puces Nvidia, y compris des processeurs, pour alimenter son infrastructure d’IA en expansion. Ce partenariat n’est pas nouveau ; Meta prévoyait auparavant d’acquérir 350 000 puces H100 d’ici fin 2024, avec un total de 1,3 million de GPU dans son arsenal d’ici 2025.
La dernière extension verra Meta déployer les processeurs de Nvidia à grande échelle aux côtés des GPU Blackwell et Rubin, optimisant ainsi ses centres de données pour la formation et l’inférence de l’IA.
L’essor des processeurs dans les charges de travail d’IA
Qu’est-ce qui motive cette demande de processeurs ? La tendance est à l’IA agentique. À mesure que les applications d’IA sont de plus en plus intégrées aux systèmes en temps réel, les processeurs jouent un rôle crucial dans la gestion du flux de données et dans la garantie de la réactivité. Un centre de données pour OpenAI nécessite désormais « des dizaines de milliers de processeurs » pour gérer les données massives générées par les GPU, un besoin qui n’existait pas avant la croissance explosive de l’IA.
Toutefois, les GPU restent dominants. L’achat de CPU par Meta est important, mais il reste éclipsé par ses acquisitions de GPU. Le processeur sert de composant de support, garantissant que l’architecture pilotée par GPU ne devienne pas un goulot d’étranglement.
Concurrence et Diversification
Les décisions de Nvidia interviennent alors que d’autres géants de l’IA diversifient leurs sources de calcul. OpenAI, Anthropic et Google explorent tous des puces personnalisées ou des partenariats avec AMD et Cerebras pour réduire la dépendance à l’égard d’un seul fournisseur. OpenAI, par exemple, a conclu des accords avec Nvidia (d’une valeur potentielle de 100 milliards de dollars) et AMD (jusqu’à 6 gigawatts de puces), ainsi qu’un accord de 10 milliards de dollars avec Cerebras.
Le problème sous-jacent reste l’offre. La demande de GPU dépasse toujours la disponibilité, ce qui pousse les entreprises à explorer des alternatives autant que possible. La récente acquisition par Nvidia de Groq, une startup de puces spécialisée dans l’inférence à faible coût, reflète cette pression.
Investissement massif de Meta dans l’infrastructure d’IA
Meta prévoit de dépenser entre 115 et 135 milliards de dollars en infrastructure d’IA cette année, contre 72,2 milliards de dollars l’année dernière, soulignant l’engagement de l’entreprise en faveur d’une croissance basée sur l’IA. Nvidia soutient depuis longtemps que son matériel prend en charge l’inférence parallèlement à la formation, avec une répartition de ses activités entre environ 40 % d’inférence et 60 % de formation il y a deux ans.
En conclusion, le partenariat de Nvidia avec Meta signifie un changement stratégique visant à répondre aux diverses demandes du marché de l’IA. La société ne se concentre plus uniquement sur les GPU haut de gamme ; il élargit activement ses offres de processeurs et consolide sa position en tant que fournisseur de calcul complet dans un paysage de plus en plus concurrentiel.
