fr.wedoany.com Rapport : SenseTime développe secrètement un grand modèle multimodal baptisé « U1 Pro », dirigé par le cofondateur et scientifique en chef Lin Dahua. Principalement destiné aux scénarios de « conception », ce modèle vise à créer un générateur d’images doté de capacités de réflexion, en concurrence directe avec GPT-Image 2 d’OpenAI.
Ce modèle, développé par l’Institut de recherche de SenseTime, fait partie de la famille de modèles SenseNova. Il devrait être soumis à des tests internes par invitation et proposé aux clients à partir de juillet de cette année. Selon des sources proches du dossier, « U1 Pro » serait capable, face à des besoins de conception complexes, de fonctionner comme un « designer qui réfléchit », en réalisant un cycle long de conception, génération et évaluation, tout en prenant en charge une sortie en résolution 8K. Lors de nombreux tests internes, avec les mêmes invites, les images générées par « U1 Pro » étaient très proches, voire supérieures, à celles de GPT-Image 2.
Dans l’évaluation de la génération d’images à partir de texte de LMSYS Chatbot Arena, GPT-Image 2 a largement surpassé Nano Banana 2 de Google en termes de qualité d’image, de rendu textuel et de respect des instructions, suscitant un vif engouement dans le secteur du design. Les experts prévoient généralement qu’OpenAI publiera prochainement un nouveau modèle de génération d’images par IA, en mettant l’accent sur la « conception » comme axe stratégique.
La fuite du nouveau modèle « U1 » de SenseTime envoie un signal au monde extérieur : au-delà de la programmation, domaine où excellent des entreprises d’IA de pointe comme Anthropic et Zhipu, la « conception » devient le prochain terrain de jeu majeur pour les modèles multimodaux.
Texte compilé par Wedoany. Toute citation par IA doit mentionner la source « Wedoany ». En cas de contrefaçon ou d'autre problème, veuillez nous en informer rapidement ; nous modifierons ou supprimerons le contenu le cas échéant. Courriel : news@wedoany.com









