La technologie de compression mémoire IA TurboQuant de Google sera présentée au Brésil lors de l'ICLR 2026 - Bulletin - Wedoany.com

Accueil Actualités Détails

La technologie de compression mémoire IA TurboQuant de Google sera présentée au Brésil lors de l'ICLR 2026

2026-04-02 15:28

Favoris

fr.wedoany.com Rapport : Google a lancé une technologie de compression mémoire IA nommée TurboQuant, visant à optimiser l'utilisation de la mémoire pour les grands modèles de langage et les moteurs de recherche vectorielle. Cette technologie peut réduire l'empreinte mémoire d'environ 6 fois, tout en augmentant la vitesse de calcul de l'attention jusqu'à 8 fois, sans perte de précision du modèle. TurboQuant devrait être officiellement présenté plus tard ce mois-ci lors de la conférence ICLR 2026 qui se tiendra à Rio de Janeiro, au Brésil.

TurboQuant combine deux technologies complémentaires : PolarQuant et l'algorithme QJL. PolarQuant simplifie la structure géométrique des vecteurs de données par rotation aléatoire, permettant une compression de haute qualité ; QJL utilise quant à lui une capacité de compression résiduelle d'environ 1 bit pour éliminer les biais, garantissant ainsi l'exactitude des scores d'attention. Google a déclaré dans son blog : « Cet algorithme crée essentiellement une sténographie à grande vitesse, sans surcharge mémoire. »

Lors de plusieurs tests de référence, tels que ZeroSCROLLS et Needle in a Haystack, TurboQuant a significativement réduit l'utilisation de la mémoire tout en maintenant une haute précision. Les tests ont montré qu'il pouvait comprimer la précision du cache de 16 bits à environ 3 bits, atteindre une accélération de 8 fois sur les GPU H100, et améliorer le taux de rappel dans la recherche vectorielle.

TurboQuant optimise non seulement l'efficacité de compression, mais atténue également les limitations de la bande passante mémoire, ouvrant de nouvelles voies pour l'extension des systèmes d'IA. Alors que la taille des modèles augmente, cette technologie qui réduit les besoins en mémoire sans affecter la précision pourrait devenir un facteur clé pour faire progresser le développement de l'IA.

Texte compilé par Wedoany. Toute citation par IA doit mentionner la source « Wedoany ». En cas de contrefaçon ou d'autre problème, veuillez nous en informer rapidement ; nous modifierons ou supprimerons le contenu le cas échéant. Courriel : news@wedoany.com

Information et communication Ingénierie de l'intelligence artificielle

Préc：LUMI AI Factory en Finlande lance le service Dataset-as-a-Service pour optimiser l'accès aux données de développement de l'IA

Suiv：TrendForce États-Unis et Taïwan Chine : La demande de serveurs IA pousse les prix contractuels de la mémoire à une forte hausse au deuxième trimestre 2026

Demander un devis

Codeur magnétique à anneau incrémental de type 202

Shanghai Complee Instrument Co., Ltd.

Demander un devis

Système de surveillance intelligente pour bande transporteuse

LUO YANG WIRE ROPE INSPECTION TECHNOLOGY CO., LTD.

Demander un devis /Unité

Radar multifonction de surveillance océanique et de détection basse altitude, mesure de l'environnement dynamique océanique à la frontière air-mer (Agent/Lancement exclusif) — Fiche technique disponible

Chengdu Dixin Technology Co., Ltd.

Demander un devis

25 Système de contrôle électro-hydraulique pour supports hydrauliques SAC

Beijing Tianma Intelligent Control Technology Co., Ltd.

Demander un devis

Terminal satellite portable à panneau plat - Terminal portable manuel de 0,35 mètre

China Starwin Science & Technology co., Ltd.

Demander un devis

Commutateur industriel entièrement national

Shenzhen Yuhang Communication Technology Co., Ltd.

Demander un devis

Stockage intelligent

Jiangsu Zhongtian Technology Co., Ltd.

Demander un devis /unit

Tablette PC industrielle robuste 10 pouces Win10 Win11 Pro Intel N100 16+512 Go IP67 4G avec code-barres NFC RJ45 et station d'accueil

Highton Electronics Co., Ltd.

Demander un devis

Fibre optique monomode à dispersion non décalée à bande passante étendue G.652.D

HONGAN GROUP CO. LTD

Demander un devis

Produit de système de multiplexage par division de longueur d’onde (WDM)

SHENZHEN SDG INFORMATION CO., LTD.

Demander un devis

Projet d’installation mécanique et électrique pour l’industrialisation de matériaux semiconducteurs composés haut de gamme et de puces

Wuhan Huakang Century Clean Technology Co., Ltd.

Demander un devis

Véhicule sans conducteur à caisse X3 Xinshiqi

Neolix Beijing Technology Co., Ltd.

Recommandés

SMIC, Hua Hong Group et d'autres entreprises chinoises s'associent pour créer le Centre international de la chaîne d'approvisionnement en matériaux électroniques de Shanghai, avec un capital social de 200 millions de yuans

TSMC Chine annonce un taux de rendement supérieur à 98 % pour son packaging avancé CoWoS, les produits au format de réticule 5,5x sont en production de masse

GITAI USA étend ses services de robotique spatiale et fait progresser les opérations en orbite et la construction d'infrastructures lunaires

Le fournisseur américain de fibre noire BIG Fiber obtient un financement par emprunt de 250 millions de dollars pour accélérer l'expansion de l'infrastructure d'IA à Atlanta et dans la baie de San Francisco

Aramco et Pasqal lancent en Arabie saoudite une plateforme commerciale de calcul quantique en tant que service

La société canadienne d'informatique quantique Nord Quantique lève 30 millions de dollars pour une valorisation de 1,4 milliard de dollars

Le MIT développe une micropuce résistant aux attaques quantiques, offrant une sécurité post-quantique aux dispositifs biomédicaux sans fil

Une équipe de l'Université de Tokyo au Japon développe une technologie de commutation ultrarapide à faible consommation d'énergie

L'américain LaunchDarkly lance la solution AgentControl pour offrir un contrôle en temps réel des agents IA en environnement de production

L'Académie chinoise des technologies de l'information et de la communication (CAICT), en collaboration avec ICBC, China Mobile et d'autres entreprises, a élaboré une série de normes intitulée « Modèle de maturité des capacités de la plateforme de données », fournissant une référence technique pour la transformation numérique et intelligente des gouvernements et des entreprises.

Derniers Bulletins

Le système de toiture réfléchissant et isolant à haute résistance aux intempéries d’Oriental Yuhong sélectionné dans le catalogue recommandé « Bon Logement »

Codelco, l’Université du Chili et l’Université catholique du Chili créent conjointement l’Institut des Mines Complexes

Le Groupe de construction étrangère de Chongqing remporte l'appel d'offres pour un projet de construction d'école au Timor oriental

Le prix de l'once d'or passe sous les 4500 dollars pour la première fois en 7 semaines

Le cours international de l'argent chute de 4 % et efface ses gains annuels

Les principaux producteurs indiens de cuivre s'opposent à la norme de qualité pour les barres de cuivre issues de déchets et proposent une norme distincte

Le port de Tacoma aux États-Unis accueille le premier navire du service FP2 modifié de ONE

La Poste chinoise ouvre la ligne de fret aérien « Zhanjiang-Nanjing »

Première poutre-caisson posée avec succès sur l'ensemble de la ligne à grande vitesse Hezhou-Zhanjiang en Chine

La gare d'Anyue de la ligne ferroviaire à grande vitesse Chengdu-Chongqing (tronçon central) est entrée en phase de décoration le 19 mai