Kingsoft Cloud prévoit d’accélérer la construction de clusters de puissance de calcul GPU au second semestre pour répondre à la demande des grands modèles de Xiaomi et Alibaba
2026-07-02 18:00
Favoris

fr.wedoany.com Rapport : Le 2 juillet, Kingsoft Cloud accélérera la construction de clusters de puissance de calcul GPU au second semestre afin de répondre à la demande croissante en puissance de calcul IA de ses clients majeurs. Cette demande provient principalement des équipes de grands modèles de Xiaomi Group et d’Alibaba Group en Chine. La demande de Xiaomi en puissance de calcul GPU auprès de Kingsoft Cloud est passée d’un cluster de dix mille cartes à un cluster de puissance de calcul à très grande échelle, avec un budget initial d’environ 4 milliards de yuans porté à plus de 10 milliards de yuans.

Le cœur de cette expansion réside dans la capacité de livraison de clusters GPU à grande échelle. L’entraînement et l’inférence des grands modèles d’IA imposent des exigences élevées en matière de nombre de serveurs, d’interconnexion GPU, de débit de stockage, de bande passante réseau, d’alimentation électrique, de dissipation thermique et d’ordonnancement des clusters. L’achat simple de serveurs GPU ne permet pas de créer directement une puissance de calcul utilisable. Les fournisseurs de cloud doivent réaliser le déploiement global des ressources de salle informatique, des serveurs à huit cartes, des réseaux de commutation, du stockage distribué, de l’ordonnancement des conteneurs, de la plateforme d’entraînement, de la surveillance des pannes et du système d’exploitation et de maintenance, afin de transformer les ressources matérielles en services de puissance de calcul IA que les clients peuvent utiliser en continu.

L’équipe de grands modèles d’Alibaba a signé un contrat de location de puissance de calcul de cinq ans avec Kingsoft Cloud, portant sur plus de 3 000 serveurs GPU à huit cartes. Selon le prix de location mensuel au moment de la signature, le chiffre d’affaires mensuel après livraison complète s’élèvera à environ 300 millions de yuans, avec un revenu annualisé dépassant 4 milliards de yuans. Pour un fournisseur de cloud, l’importance de ces contrats de location à long terme ne réside pas seulement dans l’augmentation des commandes de revenus, mais aussi dans l’amélioration de la certitude de la construction des clusters de puissance de calcul. Les clusters GPU nécessitent un investissement initial lourd et une longue période de construction ; si la demande des clients est instable, le taux d’utilisation des équipements risque d’être faible. Les contrats à long terme permettent de mieux planifier le rythme de construction, l’achat de serveurs, le déploiement des baies et l’allocation des ressources d’exploitation et de maintenance.

La mise à niveau de la demande de Xiaomi montre que la consommation de puissance de calcul dans les scénarios de grands modèles, de téléphones mobiles, de voitures et d’AIoT s’amplifie. Les besoins en IA de Xiaomi ne proviennent pas seulement de l’entraînement d’un seul modèle, mais peuvent également impliquer l’IA côté terminal des smartphones, l’habitacle intelligent des voitures, le traitement des données de conduite autonome, l’interaction vocale, les algorithmes d’imagerie, la coordination des appareils IoT et les plateformes de R&D internes de l’entreprise. Le passage d’un cluster de dix mille cartes à un cluster de puissance de calcul à très grande échelle signifie que les tâches d’entraînement, de réglage fin, d’inférence et de traitement des données passent d’une demande de projet à une demande d’infrastructure à long terme.

Kingsoft Cloud a déjà effectué plusieurs mises à niveau au niveau de la plateforme de cloud de calcul intelligent et d’IA. Sa plateforme de calcul intelligent « Kingsoft Cloud Xingliu » est passée d’une plateforme de gestion des ressources à une plateforme complète de bout en bout pour l’entraînement et l’inférence IA, couvrant l’ordonnancement des ressources hétérogènes, la gestion des tâches d’entraînement, les services d’inférence et les API de modèles. Pour les clients de grands modèles, les GPU sous-jacents ne sont qu’une base ; ce qui affecte réellement l’efficacité d’utilisation, c’est la rapidité d’allocation des ressources, la stabilité d’exécution des tâches, la gestion automatique des pannes et la fluidité de l’enchaînement entre l’entraînement et l’inférence.

La construction de clusters de puissance de calcul GPU entraînera également une demande d’équipements de communication et de centres de données. Plus de 3 000 serveurs GPU à huit cartes nécessitent un grand nombre de connexions réseau à haut débit, de commutateurs, de modules optiques, de cartes réseau, d’équipements de stockage, de baies, de systèmes d’alimentation et de distribution, ainsi que de systèmes de refroidissement liquide ou à air. Plus l’échelle de puissance de calcul est grande, plus l’architecture réseau est importante ; l’entraînement des grands modèles nécessite une coordination multi-machines et multi-cartes. Si la latence du réseau et la bande passante sont insuffisantes, l’utilisation des GPU sera réduite, ce qui affectera finalement l’efficacité réelle d’entraînement des clients.

La tâche d’expansion de Kingsoft Cloud au second semestre se concentrera sur le rythme de livraison. Le budget de Xiaomi, de l’ordre de 10 milliards de yuans, correspond à un pool de puissance de calcul à long terme à plus grande échelle, tandis que le contrat de cinq ans d’Alibaba correspond à un cluster de serveurs dont la production peut être clairement planifiée. Pour un fournisseur de cloud, il s’agit ensuite d’enchaîner la réception des serveurs GPU, leur installation en salle informatique, le débogage réseau, l’intégration de la plateforme et la validation par le client. Ce n’est qu’une fois que le cluster de puissance de calcul est livré de manière stable qu’il peut être véritablement converti en revenus d’entraînement, d’inférence et de services cloud.

Ce texte est rédigé, traduit et republié à partir des informations de l'Internet mondial et de partenaires stratégiques, uniquement pour la communication entre lecteurs. En cas d'infraction au droit d'auteur ou d'autres problèmes, veuillez nous en informer à temps pour la modification ou la suppression. La reproduction de cet article est strictement interdite sans autorisation formelle. Mail : news@wedoany.com
Produits Associés