Le cloud public chinois Huawei Cloud lance une pile d'infrastructure d'agent, prenant en charge des clusters de 100 000 cartes

2026-06-16 14:46

Favoris

fr.wedoany.com Rapport : Huawei Cloud a lancé la pile « Agentic Infra » (infrastructure d'agent), offrant une gamme complète de produits de calcul, de stockage et de réseau, conçue pour prendre en charge le fonctionnement d'agents d'IA à grande échelle sur une plateforme cloud basée sur des NPU. Cette initiative est considérée comme la démarche la plus directe de ce fournisseur de services cloud pour concurrencer Nvidia dans le domaine de l'infrastructure d'IA.

Nouveau bureau de Huawei à Jakarta, Indonésie

Lors de l'événement Inspire à Shanghai, Huawei Cloud a lancé AICS (AI Cluster Service), affirmant qu'il peut prendre en charge une plateforme de calcul comprenant un cluster de 100 000 cartes. Ce cluster fonctionne sur le protocole d'interconnexion propriétaire UnifiedBus (UB) de Huawei, offrant un débit de 5 millions de tokens par seconde entre 1 000 cartes, avec une puissance de calcul totale de 200 EFLOPS (exaflops, soit des milliards de milliards d'opérations en virgule flottante par seconde) et une latence de génération de tokens inférieure à 10 millisecondes.

Huawei a également lancé une solution de stockage nommée AMS (Agentic Memory Storage), qui offre une extension mémoire pour les puces NPU et réduit les coûts d'inférence des tâches d'agent à long cycle grâce à un cache KV (clé-valeur) hiérarchique.

Les autres composants de la pile incluent le planificateur CCE Volcano Next, qui, en fusionnant les charges de travail d'entraînement et d'inférence plutôt qu'en les isolant, prétend améliorer l'utilisation des ressources de plus de 30 % ; et AgentSphere, un environnement sandbox sécurisé et isolé où les utilisateurs peuvent lancer des centaines de milliers d'instances d'agent par minute.

Cette pile a été dévoilée lors du discours liminaire du Dr Peter Zhou, membre du conseil d'administration de Huawei et PDG de Huawei Cloud. Il a déclaré que l'IA agentique entraîne un changement fondamental du paradigme de calcul. Alors que Huawei présente sa pile d'infrastructure à Inspire, la Chine pousse à la construction d'alternatives nationales, et ce géant profite des opportunités de marché après l'interdiction des importations de puces américaines pour redoubler d'efforts dans la puissance de calcul. Bien que le PDG de Huawei, Ren Zhengfei, ait admis l'été dernier que ses puces accusaient un retard d'une génération par rapport à leurs concurrents américains, l'entreprise cherche à combler rapidement cet écart. Son principe de conception de semi-conducteurs, Tau (τ), se concentre sur l'amélioration de la conception en réduisant le délai de propagation des signaux des puces, plutôt que de réduire davantage les transistors. Huawei a utilisé ce concept pour concevoir environ 381 puces et le combinera avec l'architecture LogicFolding, qui a amélioré les performances τ à plusieurs niveaux, ce qui est crucial pour le développement de la série de processeurs Kirin.

Dans le domaine des modèles et des agents, Huawei a lancé la plateforme de modèles ModelArts Next, avec de nouvelles fonctionnalités telles que l'apprentissage par renforcement en tant que service (RLaaS) et une couche de routage de modèles, capable d'envoyer dynamiquement des requêtes au modèle le plus adapté parmi plus de 20 modèles partenaires, y compris ceux de DeepSeek, Zhipu AI et MiniMax. Huawei affirme que le moteur de routage a une précision de planification supérieure à 95 % et réduit les coûts d'inférence d'environ 20 %. Le partenariat a été officialisé sous le nom de « AI Model Partner Program ». Huawei a également lancé la plateforme d'agent d'entreprise AgentArts, destinée aux tâches d'agent à long cycle et de niveau production, avec une version open source dont la base de code partage plus de 90 % avec la version commerciale, ainsi que le portail AgentArts Orchard pour construire et déployer des agents via une interface en ligne de commande.

Huawei a introduit une couche de sécurité dédiée pour cette pile, comprenant le chiffrement matériel avec clé détenue par le client (HYOK) et la prise en charge du calcul confidentiel entre les machines virtuelles, l'entraînement et l'inférence, et affirme avoir dépassé les 1 000 jours sans incident de service majeur.

Texte compilé par Wedoany. Toute citation par IA doit mentionner la source « Wedoany ». En cas de contrefaçon ou d'autre problème, veuillez nous en informer rapidement ; nous modifierons ou supprimerons le contenu le cas échéant. Courriel : news@wedoany.com