L’équipe de l’Université nationale de Séoul développe KVzip : un bond en avant pour l’efficacité des chatbots IA
2025-11-18 17:11
Source:Seoul National University
Favoris

L’équipe du professeur Song Hyun-oh (département d’informatique et d’ingénierie, Université nationale de Séoul) a mis au point KVzip, une technologie de compression intelligente de la mémoire conversationnelle des grands modèles de langage (LLM) utilisés dans les tâches à contexte long (conversations étendues, résumés de documents). Les résultats sont disponibles sur le serveur de prépublication arXiv.

La mémoire conversationnelle stocke temporairement phrases, questions et réponses pour générer des réponses cohérentes. KVzip élimine les informations redondantes ou inutiles, réduisant fortement l’empreinte mémoire tout en accélérant les réponses sans perte de précision. Contrairement aux méthodes classiques qui se dégradent avec de nouvelles requêtes, KVzip conserve les données nécessaires à la reconstruction du contexte. Sur diverses tâches, il divise par 3 à 4 l’occupation mémoire, double la vitesse de réponse et maintient la précision. Testé avec succès sur Llama 3.1, Qwen 2.5 et Gemma 3.

Intégré à la bibliothèque open-source KVPress de NVIDIA, KVzip est prêt pour le déploiement réel. À l’avenir, il pourrait réduire drastiquement la consommation mémoire et la latence dans les systèmes d’entreprise, permettant à un serveur de gérer plus d’utilisateurs simultanés et des dialogues plus longs, donc diminuer les coûts d’exploitation. Le professeur Song Hyun-oh : « KVzip crée une mémoire réutilisable en ne gardant que l’essentiel. » Le doctorant Kim Jang-hyun, principal contributeur, ajoute : « KVzip s’intègre sans couture aux LLM du monde réel et garantit qualité et vitesse sur de longues interactions. »

Ce texte est rédigé, traduit et republié à partir des informations de l'Internet mondial et de partenaires stratégiques, uniquement pour la communication entre lecteurs. En cas d'infraction au droit d'auteur ou d'autres problèmes, veuillez nous en informer à temps pour la modification ou la suppression. La reproduction de cet article est strictement interdite sans autorisation formelle. Mail : news@wedoany.com
Innovations associées
Institut du cancer de Mass General Brigham : Le médicament ciblé pralsetinib prolonge significativement la survie des patients atteints de cancer du poumon avec fusion RET jusqu'à 44 mois
2026-04-02
Étude australienne : L'essai sur la mirtazapine montre une réduction de l'usage de méthamphétamine
2026-04-02
Des chercheurs britanniques développent un robot propulsé par le vent pour l'exploration à long terme en environnements hostiles
2026-03-21
Une nouvelle étude révèle que le désordre du système dopaminergique pourrait causer deux symptômes de la schizophrénie
2026-03-19
Une équipe de recherche américaine développe un système d'IA pour détecter les cyberattaques sur le réseau électrique en deux secondes
2026-03-18
Une étude du Houston Methodist révèle que la protéine TDP43 régule la réparation de l'ADN, impactant les maladies cérébrales et le cancer
2026-03-16
La microscopie électronique révèle de nouvelles découvertes sur l'imagerie des matériaux de batteries et propose un cadre opérationnel standardisé
2026-03-14
L'intelligence artificielle optimise les films multicouches d'oxyde de vanadium pour améliorer les performances des capteurs infrarouges
2026-03-13
Nouvelle technologie de simulation de réseau électrique accélérée pour aider aux tests de résistance des énergies renouvelables
2026-03-12
Des progrès dans la recherche sur les cathodes au soufre pour batteries à l'état solide, une voie à faible coût et haute efficacité se dessine
2026-03-11