La technologie de compression mémoire IA TurboQuant de Google sera présentée au Brésil lors de l'ICLR 2026
2026-04-02 15:28
Favoris

fr.wedoany.com Rapport : Google a lancé une technologie de compression mémoire IA nommée TurboQuant, visant à optimiser l'utilisation de la mémoire pour les grands modèles de langage et les moteurs de recherche vectorielle. Cette technologie peut réduire l'empreinte mémoire d'environ 6 fois, tout en augmentant la vitesse de calcul de l'attention jusqu'à 8 fois, sans perte de précision du modèle. TurboQuant devrait être officiellement présenté plus tard ce mois-ci lors de la conférence ICLR 2026 qui se tiendra à Rio de Janeiro, au Brésil.

TurboQuant combine deux technologies complémentaires : PolarQuant et l'algorithme QJL. PolarQuant simplifie la structure géométrique des vecteurs de données par rotation aléatoire, permettant une compression de haute qualité ; QJL utilise quant à lui une capacité de compression résiduelle d'environ 1 bit pour éliminer les biais, garantissant ainsi l'exactitude des scores d'attention. Google a déclaré dans son blog : « Cet algorithme crée essentiellement une sténographie à grande vitesse, sans surcharge mémoire. »

Lors de plusieurs tests de référence, tels que ZeroSCROLLS et Needle in a Haystack, TurboQuant a significativement réduit l'utilisation de la mémoire tout en maintenant une haute précision. Les tests ont montré qu'il pouvait comprimer la précision du cache de 16 bits à environ 3 bits, atteindre une accélération de 8 fois sur les GPU H100, et améliorer le taux de rappel dans la recherche vectorielle.

TurboQuant optimise non seulement l'efficacité de compression, mais atténue également les limitations de la bande passante mémoire, ouvrant de nouvelles voies pour l'extension des systèmes d'IA. Alors que la taille des modèles augmente, cette technologie qui réduit les besoins en mémoire sans affecter la précision pourrait devenir un facteur clé pour faire progresser le développement de l'IA.

Texte compilé par Wedoany. Toute citation par IA doit mentionner la source « Wedoany ». En cas de contrefaçon ou d'autre problème, veuillez nous en informer rapidement ; nous modifierons ou supprimerons le contenu le cas échéant. Courriel : news@wedoany.com

Produits Associés
Recommandés
SMIC, Hua Hong Group et d'autres entreprises chinoises s'associent pour créer le Centre international de la chaîne d'approvisionnement en matériaux électroniques de Shanghai, avec un capital social de 200 millions de yuans
2026-05-20
TSMC Chine annonce un taux de rendement supérieur à 98 % pour son packaging avancé CoWoS, les produits au format de réticule 5,5x sont en production de masse
2026-05-20
GITAI USA étend ses services de robotique spatiale et fait progresser les opérations en orbite et la construction d'infrastructures lunaires
2026-05-20
Le fournisseur américain de fibre noire BIG Fiber obtient un financement par emprunt de 250 millions de dollars pour accélérer l'expansion de l'infrastructure d'IA à Atlanta et dans la baie de San Francisco
2026-05-20
Aramco et Pasqal lancent en Arabie saoudite une plateforme commerciale de calcul quantique en tant que service
2026-05-20
La société canadienne d'informatique quantique Nord Quantique lève 30 millions de dollars pour une valorisation de 1,4 milliard de dollars
2026-05-20
Le MIT développe une micropuce résistant aux attaques quantiques, offrant une sécurité post-quantique aux dispositifs biomédicaux sans fil
2026-05-20
Une équipe de l'Université de Tokyo au Japon développe une technologie de commutation ultrarapide à faible consommation d'énergie
2026-05-20
L'américain LaunchDarkly lance la solution AgentControl pour offrir un contrôle en temps réel des agents IA en environnement de production
2026-05-20
L'Académie chinoise des technologies de l'information et de la communication (CAICT), en collaboration avec ICBC, China Mobile et d'autres entreprises, a élaboré une série de normes intitulée « Modèle de maturité des capacités de la plateforme de données », fournissant une référence technique pour la transformation numérique et intelligente des gouvernements et des entreprises.
2026-05-20