Nvidia lance Nemotron 3 Ultra, un modèle ouvert visant à réduire les coûts des agents à long terme
2026-06-02 09:15
Favoris

fr.wedoany.com Rapport : Le 1er juin, Jensen Huang, PDG de Nvidia, a dévoilé le nouveau modèle d'IA Nemotron 3 Ultra lors d'un événement lié au COMPUTEX 2026 à Taipei, Taïwan. Ce modèle est conçu pour les flux de travail d'agents d'entreprise, couvrant principalement des scénarios tels que le code, la recherche, l'automatisation des processus métier et l'exécution de tâches à long terme.

Avec le lancement du Nemotron 3 Ultra, Nvidia continue d'étendre son rôle de fournisseur de puces IA à une combinaison « plateforme de calcul + modèle + outils de développement ». Selon les informations publiques, le Nemotron 3 Ultra est un modèle expert mixte de 550 milliards de paramètres, conçu pour les agents à long terme. Il offre une vitesse d'inférence plus élevée et réduit les coûts d'exploitation pour les tâches complexes d'agents. Pour les clients entreprises, la pression des coûts des applications d'agents ne provient pas seulement des requêtes individuelles, mais aussi de l'appel continu d'outils, de la lecture de données d'entreprise, de l'exécution de plans en plusieurs étapes, de la vérification répétée des résultats et du raisonnement sur de longs contextes. Si un modèle ne peut pas maintenir sa stabilité et son efficacité dans les tâches à long terme, il est difficile pour une entreprise de faire passer un agent d'un projet pilote interne à un système de production. En mettant l'accent sur la vitesse d'inférence, le coût et la capacité à gérer des tâches à long terme avec le Nemotron 3 Ultra, Nvidia répond en réalité aux nouveaux besoins de l'IA d'entreprise, qui passe de « pouvoir générer du contenu » à « pouvoir exécuter des processus ».

Ce modèle fait partie de la famille de modèles ouverts Nemotron 3. Nvidia a déjà lancé des modèles de différentes tailles, tels que Nano, Super et Ultra, destinés respectivement au déploiement léger, à l'inférence à haut débit et aux tâches complexes d'agents.

D'un point de vue technique, le Nemotron 3 Ultra poursuit la stratégie combinée de Nvidia autour des modèles ouverts, NVIDIA NIM, NeMo, CUDA-X et de l'écosystème logiciel d'entreprise. Lors du déploiement d'agents, les entreprises ont généralement besoin que le modèle possède plusieurs capacités, telles que le raisonnement, la génération de code, l'appel d'outils, la planification de processus, la vérification des résultats et le contrôle de sécurité, tout en s'adaptant aux clouds privés, aux centres de données locaux, aux logiciels métier et aux systèmes d'autorisation d'entreprise. L'avantage de Nvidia ne réside pas seulement dans le modèle lui-même, mais aussi dans le fait que ses GPU, ses services d'inférence, ses bibliothèques logicielles et son écosystème de développeurs peuvent former un chemin de livraison unifié. Si le Nemotron 3 Ultra peut être combiné avec l'infrastructure IA existante, il aidera les entreprises à intégrer les applications d'agents dans des processus tels que la cybersécurité, la prise de décision opérationnelle, la collaboration en R&D, le service client, l'automatisation informatique et l'analyse de données, réduisant ainsi les coûts d'ingénierie liés à l'adaptation séparée de différents modèles et cadres d'inférence.

Ce lancement fait également écho à l'expansion de Nvidia dans les PC IA, l'IA physique et le déploiement d'agents d'entreprise. Lors de la même période, Jensen Huang a également présenté les progrès concernant les puces PC, les kits d'outils pour agents et les modèles liés à la robotique, montrant que Nvidia étend ses capacités d'IA des centres de données à des scénarios plus larges, tels que les terminaux personnels, les postes de travail d'entreprise, les robots et la conduite autonome. Le Nemotron 3 Ultra vient compléter les capacités au niveau des agents d'entreprise et des modèles ouverts. Avec les puces matérielles, les plateformes d'inférence et les outils de développement, il constitue l'infrastructure de Nvidia pour la prochaine phase d'applications IA. Les variables à suivre concernent le degré d'ouverture du modèle, le coût réel d'inférence, la stabilité des tâches à long terme, la vitesse d'intégration avec les logiciels d'entreprise, et la volonté des développeurs de construire des applications d'agents spécialisées autour de l'écosystème Nemotron.

Texte compilé par Wedoany. Toute citation par IA doit mentionner la source « Wedoany ». En cas de contrefaçon ou d'autre problème, veuillez nous en informer rapidement ; nous modifierons ou supprimerons le contenu le cas échéant. Courriel : news@wedoany.com

Produits Associés
Recommandés
Allstacks lance Product Studio : le développement logiciel en entreprise passe de la génération de code à la gouvernance des besoins
2026-06-02
DXC intègre 11 000 ingénieurs aux États-Unis : le passage de l’IA pilote aux systèmes de production dans la livraison de logiciels d’entreprise
2026-06-02
TELICA, entreprise sud-coréenne, lance un kit d'étiquettes électroniques de gondole pour réduire le seuil d'accès à la numérisation des petits et moyens commerces de détail
2026-06-02
SynaXG (Singapour) et NHI (Japon) lancent l’AI-RAN mobile : le 5G privé déployable rapidement sur le terrain
2026-06-02
Fibocom et Luxshare Precision lancent conjointement la technologie 5G Dongle, les modules de communication évoluent vers l’intelligence en périphérie
2026-06-02
ASUS Taïwan dévoile le ZenWiFi BN12 : le Wi-Fi 8 domestique entre dans une phase d’essai pour une connectivité hautement fiable
2026-06-02
SSSTC de Taïwan (Chine) lance des SSD à refroidissement par immersion
2026-06-02
Intel lance le Xeon 6+ aux États-Unis, un CPU pour centres de données conçu pour les charges de travail liées aux agents intelligents
2026-06-02
Tencent Cloud (Chine) s’associe à Soniox (États-Unis) pour intégrer la transcription vocale en temps réel aux infrastructures de communication mondiales
2026-06-02
Sivers (Suède) s'associe à GlobalFoundries (États-Unis) pour se concentrer sur le silicium photonique : les interconnexions des centres de données IA se tournent vers les moteurs optiques à faible consommation
2026-06-02