La plateforme cloud IA américaine GMI Cloud soutient la construction d’usines d’IA agentiques Vera Rubin
2026-06-05 10:18
Favoris

fr.wedoany.com Rapport : Récemment, la société américaine d’infrastructure cloud native IA GMI Cloud a annoncé que sa plateforme soutiendrait la construction d’une nouvelle génération d’infrastructures dédiées aux usines d’IA agentiques, en phase avec la plateforme Vera Rubin promue par NVIDIA lors du GTC 2026 à Taipei. L’entreprise construit une plateforme cloud centrée sur l’inférence, offrant aux développeurs et aux entreprises la capacité de déployer, faire évoluer et exécuter des charges de travail d’IA de niveau production.

L’accent mis par GMI Cloud sur les « usines d’IA agentiques » répond aux nouvelles exigences d’infrastructure souterraines lorsque les applications d’IA passent de requêtes uniques à une exécution à long terme, une collaboration autonome et un traitement multimodal. Les ressources cloud IA traditionnelles sont davantage axées sur l’entraînement de modèles, l’inférence de modèles uniques ou les appels API. Lorsque les agents IA commencent à planifier, appeler des outils, traiter des images, vidéos et audios, conserver un contexte mémoire et fonctionner en continu, la plateforme doit simultanément prendre en charge une inférence à haut débit et faible latence, une mise à l’échelle dynamique, un isolement multi-locataire, une gestion de contexte à long terme, une orchestration de flux de travail et un environnement d’exécution sécurisé. La gamme de plateformes de GMI Cloud comprend des infrastructures d’entraînement, d’inférence et de déploiement de production, le service de modèles à faible latence Prime Inference, l’API MaaS pour modèles propriétaires et open source, des points de terminaison dédiés aux entreprises, ainsi qu’une couche d’orchestration et d’optimisation d’infrastructure pour des opérations IA évolutives.

L’infrastructure de flux de travail agentique est un élément clé de cette annonce. Les capacités de la plateforme proposées par GMI Cloud couvrent les systèmes IA autonomes en bac à sable, basés sur des appels d’outils, et prennent en charge un environnement de déploiement natif multimodal pour les applications IA de nouvelle génération. Pour les clients entreprises, ces capacités peuvent être utilisées pour construire des agents de service client en continu, des agents de code, des agents d’analyse de données, des systèmes de génération de contenu, des assistants de processus industriels et des flux de travail d’automatisation métier. Par rapport aux appels de modèles classiques, les systèmes IA agentiques doivent maintenir un état sur une plus longue durée, accéder à des outils, lire et écrire des données externes, et allouer des ressources entre plusieurs tâches. Ainsi, la stabilité, l’isolement et la maîtrise des coûts de la plateforme cloud sous-jacente affectent directement la qualité du déploiement en production.

La sécurité est également placée au cœur de l’infrastructure des usines d’IA. GMI Cloud indique qu’elle adopte les capacités de calcul confidentiel de NVIDIA pour fournir un environnement d’exécution de confiance aux charges de travail IA de nouvelle génération nécessitant la protection des modèles et de la confidentialité des données. Alors que les usines d’IA traitent des données propriétaires d’entreprise, des contenus réglementés, des contextes de modèles et des mémoires d’agents, la plateforme d’inférence doit simultanément répondre aux exigences de performance, de confidentialité, de sécurité et de conformité. La plateforme Vera Rubin est considérée comme un jalon important dans l’évolution de l’infrastructure des usines d’IA, conçue autour du calcul, du réseau, de la sécurité et des systèmes au niveau rack de nouvelle génération, pour répondre aux besoins d’inférence à grande échelle et de fonctionnement continu des IA agentiques.

Cette annonce reflète le passage de la concurrence dans l’infrastructure cloud IA de « fournir une puissance de calcul GPU » à « soutenir des systèmes intelligents de niveau production ». Alors que les applications IA entrent dans les processus centraux des entreprises, les clients ne se soucient pas seulement de pouvoir louer des GPU, mais aussi de la latence des services de modèles, du coût des tokens, de la disponibilité de la plateforme, de l’isolement sécuritaire, de l’orchestration des flux de travail, des points de terminaison dédiés, de la portée d’accès aux modèles et de la capacité à gérer des tâches multimodales. En choisissant de se positionner autour d’une architecture native d’inférence et d’usines d’IA agentiques, GMI Cloud montre qu’elle souhaite jouer un rôle plus proche de la couche d’exécution de production dans la chaîne d’infrastructure IA. Les variables clés à venir résident dans la capacité de GMI Cloud à combiner l’écosystème Vera Rubin, les capacités de calcul confidentiel et la plateforme d’inférence en un produit évolutif, et à attirer davantage de développeurs, de startups et de clients entreprises pour déployer des agents IA complexes sur sa plateforme cloud.

Texte compilé par Wedoany. Toute citation par IA doit mentionner la source « Wedoany ». En cas de contrefaçon ou d'autre problème, veuillez nous en informer rapidement ; nous modifierons ou supprimerons le contenu le cas échéant. Courriel : news@wedoany.com

Recommandés
La société singapourienne de technologie d’intelligence artificielle Univers lance une plateforme d’IA physique gérant plus de mille GW d’actifs
2026-06-17
GFiber s’associe à Quext, fournisseur de technologies immobilières intelligentes, pour lancer la fibre optique à 3 gigabits à Pacifica Place, en Californie
2026-06-17
L'opérateur de télécommunications angolais Mercury signe un accord satellite de plusieurs millions de dollars avec Eutelsat
2026-06-17
Unity, la société américaine de moteurs de jeux, offre officiellement son support pour les lunettes XR
2026-06-17
L'entreprise sud-coréenne d'IA et d'analyse de big data S2W s'associe à E-Papyrus pour lancer Streamdocs AI, un justificatif électronique basé sur l'IA
2026-06-17
GS Neotek (Corée du Sud) et Tencent Cloud (Chine) signent un accord pour promouvoir conjointement les services CDN et cloud mondiaux
2026-06-17
AMD annonce un rachat majeur pour renforcer ses technologies d'optimisation mémoire
2026-06-17
Google Cloud lance une plateforme d’opérations de sécurité en Corée du Sud, réduisant les enquêtes à une minute
2026-06-17
L'Agence coréenne de promotion de l'Internet et de la sécurité (KISA) sélectionne 6 consortiums pour lancer un projet de système national de cybersécurité d'un montant de 4,5 milliards de wons
2026-06-17
L’entreprise américaine d’intelligence artificielle générative Anthropic recrute un ancien cadre de Meta pour diriger la chaîne d’approvisionnement des centres de données
2026-06-17
Derniers Bulletins
1
La nouvelle base aérienne de Porter Airlines entre en service, avec 11 nouvelles lignes
2
AtkinsRéalis, société canadienne de gestion de projets d'ingénierie, a été mandatée par la société de développement azerbaïdjanaise pour améliorer les routes du secteur est de la Ville Blanche de Bakou.
3
Virtuo développe une plateforme logistique multi-étages à Bezons, d'une superficie totale de plus de 36 000 m²
4
L'entreprise américaine de béton prêt à l'emploi Suncrete acquiert ABC Block Co. pour étendre sa capacité de production de blocs et sa distribution
5
La société des eaux de Saint Paul (Minnesota) investit 2,8 millions de dollars dans des bassins de rétention, dont l'achèvement est prévu en 2029
6
Le Musée Picasso de Paris lance un plan de rénovation de 50 millions d’euros
7
Pulsant, spécialiste du traitement numérique en périphérie, achève la modernisation de son parc de centres de données au Royaume-Uni pour 2 millions de livres sterling
8
Le Département des Sciences et Technologies des Philippines et l'Université des Sciences et Technologies du Sud des Philippines inaugurent un laboratoire capable de réduire de 68 % la consommation énergétique de refroidissement des bâtiments résidentiels et commerciaux
9
Built Robotics et le xLAB de l’Université de Pennsylvanie lancent une IA pour la sécurité dans le bâtiment
10
L'entreprise britannique de traitement de l'eau Curio Water obtient un contrat de maintenance pour l'usine d'ozone de Severn Trent