Unisound dévoile le grand modèle U2, avec un score de 87,9 sur GPQA Diamond

2026-06-08 13:37

Favoris

fr.wedoany.com Rapport : Unisound a publié le 8 juin 2026 sa nouvelle génération de grand modèle de langage généraliste U2. Ce modèle, conçu comme un grand modèle Agent natif destiné aux particuliers, développeurs et organisations, repose sur les principes de haute densité d’intelligence et de haute valeur des tokens, sans accumulation aveugle de paramètres ni de longueur de sortie.

Contrairement aux modèles de langage généralistes traditionnels orientés vers des échanges à tour unique, U2 met l’accent sur l’exécution continue de tâches dans le monde réel. Dans des scénarios tels que le travail de bureau complexe, le génie logiciel, la recherche approfondie et la collaboration multi-outils, U2 peut décomposer et exécuter de manière autonome des workflows de plus de 100 étapes, reliant la compréhension des besoins, la planification des tâches, l’interaction avec l’environnement, l’utilisation des outils, la correction en cours de processus et la validation des résultats en une boucle d’exécution fermée, passant de la fourniture de réponses à l’accomplissement de tâches.

En matière d’évaluation, U2 obtient un score de 87,9 sur GPQA Diamond, qui mesure les connaissances et les capacités de raisonnement complexes, surpassant GLM-5.1, Hy3 preview, DeepSeek-V4-Flash (High) et MiniMax M2.7. Sur SWE-Bench Verified, qui évalue les compétences en génie logiciel, il obtient un score de 75, se classant parmi les meilleurs modèles dominants. Sur Claw-Eval (pass@3), une évaluation de bout en bout de l’exécution autonome des Agents, il atteint 76,9, dépassant également Hy3 preview, DeepSeek-V4-Flash (High) et MiniMax M2.7. Sur GDPval, qui évalue la capacité de livraison en matière de travail de bureau et de connaissances, il obtient 72,9, ce benchmark se concentrant sur l’achèvement de tâches typiques de bureau telles que l’analyse de documents, la rédaction de rapports, le traitement de feuilles de calcul, la génération de graphiques et la création de présentations.

Unisound indique que la conception d’U2 ne repose pas sur une seule capacité isolée, mais offre des performances systémiques en matière de raisonnement, de programmation, d’exécution d’Agent et de livraison de bureau. Pour atteindre les objectifs d’exécution des tâches, U2 introduit un mécanisme de pensée hybride, basculant dynamiquement entre la chaîne de pensée explicite et le raisonnement dans l’espace latent en fonction de l’étape de la tâche, de sa complexité et de son incertitude au cours d’un même processus de raisonnement. Au début d’une tâche, le modèle effectue une recherche de chemin, une décomposition de la tâche et une génération de solutions candidates dans l’espace latent ; lors des phases de jugement critique ou de traitement des contraintes, il passe au raisonnement explicite pour un calibrage logique et une convergence des résultats. Grâce à une déduction latente bornée et à un basculement basé sur l’entropie, le modèle peut ajuster dynamiquement son mode de pensée en fonction de l’incertitude au cours du raisonnement.

Sur le plan des connaissances de base, U2 applique des techniques de filtrage et de purification des données à haute densité de connaissances, éliminant les données redondantes et de faible qualité, et combine un codage de connaissances éparses et une architecture de distillation des connaissances pour compresser les paramètres redondants du modèle. Au niveau de l’exécution des tâches, il introduit un paradigme d’entraînement collaboratif Agent-Harness, intégrant l’amélioration des capacités du modèle et l’optimisation de la chaîne d’outils dans une même boucle d’entraînement, permettant aux trajectoires d’exécution de haute qualité générées dans des tâches réelles de rétroagir sur le modèle, renforçant ainsi ses capacités en matière de planification, d’utilisation des outils, de correction en cours de processus et de validation des résultats.

U2 se concentre sur trois capacités fondamentales : le raisonnement, la programmation et l’Agent. En matière de raisonnement, il met l’accent sur une exécution à faible biais et une stabilité logique à long terme ; en programmation, il est orienté vers la livraison de bout en bout en génie logiciel, capable de générer du code à partir de besoins en langage naturel et de comprendre la structure de projets multi-fichiers ; en matière de capacités d’Agent, il vise à améliorer la collaboration multi-outils, l’orchestration de longs workflows et l’interaction avec l’environnement. Ces capacités forment une boucle fermée de livraison de tâches, allant de la compréhension des besoins à la planification, l’exécution et la validation collaborative.

En termes de scénarios d’application, U2 peut couvrir une large gamme de conceptions d’interfaces, y compris le développement de sites Web réactifs, la construction d’applications Web mobiles et la mise en œuvre de systèmes de conception ; la recherche et l’analyse approfondies, incluant la recherche sectorielle et politique, l’analyse de données visuelles et la livraison de documents multi-formats ; le développement de jeux interactifs immersifs, tels que des jeux de loisirs classiques et des simulateurs physiques ; ainsi que l’automatisation efficace du travail de bureau, comprenant l’analyse de rapports commerciaux, l’analyse de la structure sectorielle et les bilans périodiques d’activité. U2 est désormais disponible sur Token Hub d’Unisound, ouvert aux particuliers, développeurs et organisations.

Texte compilé par Wedoany. Toute citation par IA doit mentionner la source « Wedoany ». En cas de contrefaçon ou d'autre problème, veuillez nous en informer rapidement ; nous modifierons ou supprimerons le contenu le cas échéant. Courriel : news@wedoany.com

Chine

Information et communication Ingénierie de l'intelligence artificielle

Ce texte est rédigé, traduit et republié à partir des informations de l'Internet mondial et de partenaires stratégiques, uniquement pour la communication entre lecteurs. En cas d'infraction au droit d'auteur ou d'autres problèmes, veuillez nous en informer à temps pour la modification ou la suppression. La reproduction de cet article est strictement interdite sans autorisation formelle. Mail : news@wedoany.com

Préc：Le géant chinois Tencent s’associe à Huawei et d’autres marques pour conquérir l’IA mobile

Suiv：GIGABYTE Taïwan dévoile des optimisations IA pour améliorer les performances des cartes mères