Percée de l’Université des Sciences et Technologies d’Ulsan (Corée du Sud) : amélioration des performances des modèles d’IA générative
2025-11-17 16:50
Source:UNIST
Favoris

Lorsque les utilisateurs demandent à ChatGPT de générer des images dans le style Ghibli, c’est en réalité DALL-E qui produit l’image. Cet outil basé sur un modèle de diffusion peut créer des visuels époustouflants, mais il présente des limites : erreurs occasionnelles comme des mains à trois doigts ou des visages déformés, et difficultés à fonctionner sur des appareils à ressources computationnelles limitées. Une équipe dirigée par les professeurs Ryu Jae-jun et Yoon Sung-hwan de l’École supérieure d’intelligence artificielle de l’Université des Sciences et Technologies d’Ulsan (UNIST) a proposé un nouveau principe de conception pour les IA génératives afin de résoudre ces problèmes.

1 / 1理论分析的概念图。定理 1(扩散模型的推论 1)将参数空间中的扰动转化为扰动分布的集合。定理 2(扩散模型的推论 2)表明平坦的极小值能够增强模型对分布间隙的鲁棒性。

Les modèles de diffusion, utilisés dans des applications populaires comme DALL-E et Stable Diffusion, permettent le transfert de style ou la création de dessins animés, mais souffrent, lors du déploiement, d’une accumulation d’erreurs, de dégradation des performances et d’une vulnérabilité aux attaques adverses. L’équipe a découvert que ces problèmes proviennent d’une capacité de généralisation limitée du modèle, c’est-à-dire de sa difficulté à fonctionner de manière fiable sur de nouvelles données ou dans des environnements inconnus.

Pour y remédier, les chercheurs ont proposé d’orienter l’entraînement vers des « minima plats » (flat minima) situés sur la surface de la fonction de perte du modèle – des zones larges et peu pentues qui assurent une stabilité et une fiabilité même en cas de petites perturbations ou de bruit. Parmi les algorithmes recherchant ces minima plats, la minimisation perceptive de la netteté (Sharpness-Aware Minimization, SAM) s’est révélée la plus efficace. Les modèles entraînés avec SAM accumulent moins d’erreurs lors de tâches de génération rapide, conservent une meilleure qualité après compression et voient leur résistance aux attaques adverses multipliée par sept, renforçant considérablement leur robustesse.

L’équipe souligne que se concentrer sur les minima plats offre une solution unifiée aux problèmes d’accumulation d’erreurs, d’erreurs de quantification et de vulnérabilités adverses. Le cadre proposé améliore non seulement la qualité des images, mais permet aussi de concevoir des systèmes d’IA générative fiables et complets, applicables efficacement dans divers secteurs et scénarios réels, même avec des données limitées pour entraîner de grands modèles.

Ce texte est rédigé, traduit et republié à partir des informations de l'Internet mondial et de partenaires stratégiques, uniquement pour la communication entre lecteurs. En cas d'infraction au droit d'auteur ou d'autres problèmes, veuillez nous en informer à temps pour la modification ou la suppression. La reproduction de cet article est strictement interdite sans autorisation formelle. Mail : news@wedoany.com
Innovations associées
Institut du cancer de Mass General Brigham : Le médicament ciblé pralsetinib prolonge significativement la survie des patients atteints de cancer du poumon avec fusion RET jusqu'à 44 mois
2026-04-02
Étude australienne : L'essai sur la mirtazapine montre une réduction de l'usage de méthamphétamine
2026-04-02
Des chercheurs britanniques développent un robot propulsé par le vent pour l'exploration à long terme en environnements hostiles
2026-03-21
Une nouvelle étude révèle que le désordre du système dopaminergique pourrait causer deux symptômes de la schizophrénie
2026-03-19
Une équipe de recherche américaine développe un système d'IA pour détecter les cyberattaques sur le réseau électrique en deux secondes
2026-03-18
Une étude du Houston Methodist révèle que la protéine TDP43 régule la réparation de l'ADN, impactant les maladies cérébrales et le cancer
2026-03-16
La microscopie électronique révèle de nouvelles découvertes sur l'imagerie des matériaux de batteries et propose un cadre opérationnel standardisé
2026-03-14
L'intelligence artificielle optimise les films multicouches d'oxyde de vanadium pour améliorer les performances des capteurs infrarouges
2026-03-13
Nouvelle technologie de simulation de réseau électrique accélérée pour aider aux tests de résistance des énergies renouvelables
2026-03-12
Des progrès dans la recherche sur les cathodes au soufre pour batteries à l'état solide, une voie à faible coût et haute efficacité se dessine
2026-03-11