fr.wedoany.com Rapport : Nvidia a informé ses clients chinois que le processeur serveur Vera, basé sur l'architecture Arm, pourrait arriver dès le mois d'août et que les commandes sont acceptées dès maintenant. Auparavant, lors du Computex, la société avait indiqué que les systèmes Vera commenceraient à être livrés à l'automne via des intégrateurs système et des partenaires cloud.
Parallèlement, les expéditions du GPU AI H200 vers la Chine restent gelées. Le PDG de Nvidia, Jensen Huang, avait déclaré il y a plusieurs mois que la part de marché de l'entreprise en Chine était en réalité tombée à zéro. Dans un contexte de pénurie mondiale de CPU serveurs, Nvidia informe les acheteurs chinois qu'ils peuvent obtenir des puces dès août, ce qui signifie qu'ils sont bien placés dans la file d'attente d'allocation de cette gamme de produits. Nvidia prévoit que la gamme Vera générera 200 milliards de dollars de revenus d'ici la fin de l'exercice financier en janvier.
Selon Reuters, citant trois sources proches du dossier, les entreprises cloud chinoises testent déjà plus de 300 serveurs Vera, et au moins un grand fournisseur de cloud prévoit de passer commande. Une source indique que le déploiement initial se limitera aux centres de données à l'étranger de ces entreprises. Si tout se passe bien, Vera touchera des acheteurs chinois que les GPU Nvidia ne peuvent pas atteindre. Comparés aux accélérateurs GPU, les CPU serveurs sont soumis à des restrictions d'exportation américaines beaucoup plus souples. Les États-Unis ont approuvé l'achat de H200 par environ dix entreprises chinoises, mais aucune livraison n'a eu lieu en raison du refus des autorités chinoises, qui souhaitent soutenir les fabricants locaux de puces.
Le déploiement du CPU Vera est limité aux centres de données à l'étranger, car les fournisseurs cloud chinois, bien que désireux d'acquérir ce matériel, craignent que l'installation de puces américaines dans leurs centres de données nationaux n'attire l'attention de Pékin. Vera était initialement la partie CPU de la superpuce Vera Rubin, dévoilée pour la première fois lors de l'événement GTC de l'année dernière. Nvidia l'a présenté comme un produit autonome lors du GTC San Jose en mars de cette année, tout en dévoilant une conception de rack pouvant accueillir 256 CPU Vera refroidis par liquide, supportant plus de 22 500 environnements CPU simultanés. Lors du Computex, Nvidia a indiqué que la puce était en production de masse et qu'elle était 1,8 fois plus rapide que les processeurs x86 pour les charges de travail d'agents intelligents. Son prédécesseur, Grace, a été expédié à près de 2,5 millions d'unités à ce jour.
Les CPU serveurs subissent des pressions d'approvisionnement en raison du passage des charges de travail IA de l'entraînement à l'inférence et à l'exécution d'agents. L'IA agentique dépend fortement du processeur principal pour les appels d'outils, l'exécution de code et le traitement des données. En raison de l'explosion des applications agentiques, la demande de CPU a dépassé l'offre. Intel a donné à ses clients chinois des délais de livraison allant jusqu'à six mois, tandis qu'AMD a indiqué que le marché mondial des CPU est tendu, que la demande dépasse les prévisions et que les contraintes d'approvisionnement devraient persister.
Texte compilé par Wedoany. Toute citation par IA doit mentionner la source « Wedoany ». En cas de contrefaçon ou d'autre problème, veuillez nous en informer rapidement ; nous modifierons ou supprimerons le contenu le cas échéant. Courriel : news@wedoany.com









