fr.wedoany.com Rapport : Récemment, la société américaine d’infrastructure cloud native IA GMI Cloud a annoncé que sa plateforme soutiendrait la construction d’une nouvelle génération d’infrastructures dédiées aux usines d’IA agentiques, en phase avec la plateforme Vera Rubin promue par NVIDIA lors du GTC 2026 à Taipei. L’entreprise construit une plateforme cloud centrée sur l’inférence, offrant aux développeurs et aux entreprises la capacité de déployer, faire évoluer et exécuter des charges de travail d’IA de niveau production.
L’accent mis par GMI Cloud sur les « usines d’IA agentiques » répond aux nouvelles exigences d’infrastructure souterraines lorsque les applications d’IA passent de requêtes uniques à une exécution à long terme, une collaboration autonome et un traitement multimodal. Les ressources cloud IA traditionnelles sont davantage axées sur l’entraînement de modèles, l’inférence de modèles uniques ou les appels API. Lorsque les agents IA commencent à planifier, appeler des outils, traiter des images, vidéos et audios, conserver un contexte mémoire et fonctionner en continu, la plateforme doit simultanément prendre en charge une inférence à haut débit et faible latence, une mise à l’échelle dynamique, un isolement multi-locataire, une gestion de contexte à long terme, une orchestration de flux de travail et un environnement d’exécution sécurisé. La gamme de plateformes de GMI Cloud comprend des infrastructures d’entraînement, d’inférence et de déploiement de production, le service de modèles à faible latence Prime Inference, l’API MaaS pour modèles propriétaires et open source, des points de terminaison dédiés aux entreprises, ainsi qu’une couche d’orchestration et d’optimisation d’infrastructure pour des opérations IA évolutives.
L’infrastructure de flux de travail agentique est un élément clé de cette annonce. Les capacités de la plateforme proposées par GMI Cloud couvrent les systèmes IA autonomes en bac à sable, basés sur des appels d’outils, et prennent en charge un environnement de déploiement natif multimodal pour les applications IA de nouvelle génération. Pour les clients entreprises, ces capacités peuvent être utilisées pour construire des agents de service client en continu, des agents de code, des agents d’analyse de données, des systèmes de génération de contenu, des assistants de processus industriels et des flux de travail d’automatisation métier. Par rapport aux appels de modèles classiques, les systèmes IA agentiques doivent maintenir un état sur une plus longue durée, accéder à des outils, lire et écrire des données externes, et allouer des ressources entre plusieurs tâches. Ainsi, la stabilité, l’isolement et la maîtrise des coûts de la plateforme cloud sous-jacente affectent directement la qualité du déploiement en production.
La sécurité est également placée au cœur de l’infrastructure des usines d’IA. GMI Cloud indique qu’elle adopte les capacités de calcul confidentiel de NVIDIA pour fournir un environnement d’exécution de confiance aux charges de travail IA de nouvelle génération nécessitant la protection des modèles et de la confidentialité des données. Alors que les usines d’IA traitent des données propriétaires d’entreprise, des contenus réglementés, des contextes de modèles et des mémoires d’agents, la plateforme d’inférence doit simultanément répondre aux exigences de performance, de confidentialité, de sécurité et de conformité. La plateforme Vera Rubin est considérée comme un jalon important dans l’évolution de l’infrastructure des usines d’IA, conçue autour du calcul, du réseau, de la sécurité et des systèmes au niveau rack de nouvelle génération, pour répondre aux besoins d’inférence à grande échelle et de fonctionnement continu des IA agentiques.
Cette annonce reflète le passage de la concurrence dans l’infrastructure cloud IA de « fournir une puissance de calcul GPU » à « soutenir des systèmes intelligents de niveau production ». Alors que les applications IA entrent dans les processus centraux des entreprises, les clients ne se soucient pas seulement de pouvoir louer des GPU, mais aussi de la latence des services de modèles, du coût des tokens, de la disponibilité de la plateforme, de l’isolement sécuritaire, de l’orchestration des flux de travail, des points de terminaison dédiés, de la portée d’accès aux modèles et de la capacité à gérer des tâches multimodales. En choisissant de se positionner autour d’une architecture native d’inférence et d’usines d’IA agentiques, GMI Cloud montre qu’elle souhaite jouer un rôle plus proche de la couche d’exécution de production dans la chaîne d’infrastructure IA. Les variables clés à venir résident dans la capacité de GMI Cloud à combiner l’écosystème Vera Rubin, les capacités de calcul confidentiel et la plateforme d’inférence en un produit évolutif, et à attirer davantage de développeurs, de startups et de clients entreprises pour déployer des agents IA complexes sur sa plateforme cloud.
Texte compilé par Wedoany. Toute citation par IA doit mentionner la source « Wedoany ». En cas de contrefaçon ou d'autre problème, veuillez nous en informer rapidement ; nous modifierons ou supprimerons le contenu le cas échéant. Courriel : news@wedoany.com









