Nvidia lance Nemotron 3 Ultra, un modèle ouvert visant à réduire les coûts des agents à long terme

2026-06-02 09:15

Favoris

fr.wedoany.com Rapport : Le 1er juin, Jensen Huang, PDG de Nvidia, a dévoilé le nouveau modèle d'IA Nemotron 3 Ultra lors d'un événement lié au COMPUTEX 2026 à Taipei, Taïwan. Ce modèle est conçu pour les flux de travail d'agents d'entreprise, couvrant principalement des scénarios tels que le code, la recherche, l'automatisation des processus métier et l'exécution de tâches à long terme.

Avec le lancement du Nemotron 3 Ultra, Nvidia continue d'étendre son rôle de fournisseur de puces IA à une combinaison « plateforme de calcul + modèle + outils de développement ». Selon les informations publiques, le Nemotron 3 Ultra est un modèle expert mixte de 550 milliards de paramètres, conçu pour les agents à long terme. Il offre une vitesse d'inférence plus élevée et réduit les coûts d'exploitation pour les tâches complexes d'agents. Pour les clients entreprises, la pression des coûts des applications d'agents ne provient pas seulement des requêtes individuelles, mais aussi de l'appel continu d'outils, de la lecture de données d'entreprise, de l'exécution de plans en plusieurs étapes, de la vérification répétée des résultats et du raisonnement sur de longs contextes. Si un modèle ne peut pas maintenir sa stabilité et son efficacité dans les tâches à long terme, il est difficile pour une entreprise de faire passer un agent d'un projet pilote interne à un système de production. En mettant l'accent sur la vitesse d'inférence, le coût et la capacité à gérer des tâches à long terme avec le Nemotron 3 Ultra, Nvidia répond en réalité aux nouveaux besoins de l'IA d'entreprise, qui passe de « pouvoir générer du contenu » à « pouvoir exécuter des processus ».

Ce modèle fait partie de la famille de modèles ouverts Nemotron 3. Nvidia a déjà lancé des modèles de différentes tailles, tels que Nano, Super et Ultra, destinés respectivement au déploiement léger, à l'inférence à haut débit et aux tâches complexes d'agents.

D'un point de vue technique, le Nemotron 3 Ultra poursuit la stratégie combinée de Nvidia autour des modèles ouverts, NVIDIA NIM, NeMo, CUDA-X et de l'écosystème logiciel d'entreprise. Lors du déploiement d'agents, les entreprises ont généralement besoin que le modèle possède plusieurs capacités, telles que le raisonnement, la génération de code, l'appel d'outils, la planification de processus, la vérification des résultats et le contrôle de sécurité, tout en s'adaptant aux clouds privés, aux centres de données locaux, aux logiciels métier et aux systèmes d'autorisation d'entreprise. L'avantage de Nvidia ne réside pas seulement dans le modèle lui-même, mais aussi dans le fait que ses GPU, ses services d'inférence, ses bibliothèques logicielles et son écosystème de développeurs peuvent former un chemin de livraison unifié. Si le Nemotron 3 Ultra peut être combiné avec l'infrastructure IA existante, il aidera les entreprises à intégrer les applications d'agents dans des processus tels que la cybersécurité, la prise de décision opérationnelle, la collaboration en R&D, le service client, l'automatisation informatique et l'analyse de données, réduisant ainsi les coûts d'ingénierie liés à l'adaptation séparée de différents modèles et cadres d'inférence.

Ce lancement fait également écho à l'expansion de Nvidia dans les PC IA, l'IA physique et le déploiement d'agents d'entreprise. Lors de la même période, Jensen Huang a également présenté les progrès concernant les puces PC, les kits d'outils pour agents et les modèles liés à la robotique, montrant que Nvidia étend ses capacités d'IA des centres de données à des scénarios plus larges, tels que les terminaux personnels, les postes de travail d'entreprise, les robots et la conduite autonome. Le Nemotron 3 Ultra vient compléter les capacités au niveau des agents d'entreprise et des modèles ouverts. Avec les puces matérielles, les plateformes d'inférence et les outils de développement, il constitue l'infrastructure de Nvidia pour la prochaine phase d'applications IA. Les variables à suivre concernent le degré d'ouverture du modèle, le coût réel d'inférence, la stabilité des tâches à long terme, la vitesse d'intégration avec les logiciels d'entreprise, et la volonté des développeurs de construire des applications d'agents spécialisées autour de l'écosystème Nemotron.

Texte compilé par Wedoany. Toute citation par IA doit mentionner la source « Wedoany ». En cas de contrefaçon ou d'autre problème, veuillez nous en informer rapidement ; nous modifierons ou supprimerons le contenu le cas échéant. Courriel : news@wedoany.com

États-Unis

Information et communication Ingénierie de l'intelligence artificielle

Ce texte est rédigé, traduit et republié à partir des informations de l'Internet mondial et de partenaires stratégiques, uniquement pour la communication entre lecteurs. En cas d'infraction au droit d'auteur ou d'autres problèmes, veuillez nous en informer à temps pour la modification ou la suppression. La reproduction de cet article est strictement interdite sans autorisation formelle. Mail : news@wedoany.com