fr.wedoany.com Rapport : Face à l'énorme demande des centres de données à forte consommation énergétique liée à l'intelligence artificielle, des chercheurs d'Extropic Corp. et du Massachusetts Institute of Technology (MIT), dont le spécialiste de l'information quantique Isaac Chuang, ont proposé une architecture d'ordinateur thermodynamique débruitée (Denoising Thermodynamic Computer Architecture, DTCA), affirmant pouvoir exécuter certaines tâches d'IA avec une fraction infime de l'énergie consommée par le matériel traditionnel. Les résultats ont été publiés dans npj Unconventional Computing.
Cette étude vise à relever un défi central de l'industrie de l'IA. L'équipe souligne que les investissements dans les systèmes d'IA à grande échelle exercent une pression considérable sur les infrastructures énergétiques mondiales, et qu'à l'horizon 2030, les centres de données axés sur l'IA pourraient consommer environ 10 % de l'énergie totale des États-Unis. L'efficacité des architectures traditionnelles de GPU (unités de traitement graphique) progresse de manière limitée, et les algorithmes d'IA eux-mêmes pourraient être contraints par le matériel existant, d'où l'importance de trouver des voies de calcul alternatives.
Cette proposition conçoit une architecture informatique probabiliste basée sur des transistors CMOS traditionnels, utilisant un caractère aléatoire contrôlé pour effectuer des calculs probabilistes directement dans le matériel. Son principe s'inspire du concept des modèles de diffusion, décomposant les tâches complexes de modélisation probabiliste en une série d'étapes simples de débruitage, transformant progressivement un bruit aléatoire en données structurées, contournant ainsi les limitations antérieures des matériels probabilistes liées au « compromis mélange-exprimité ». Le cœur du matériel est un circuit à transistors spécialement conçu pour générer des nombres aléatoires programmables, ces bits aléatoires constituant la base des calculs probabilistes sur la puce, et permettant, via un réseau modulaire, la mise en œuvre de plusieurs machines de Boltzmann clairsemées en série. Cette conception modulaire peut être réalisée par plusieurs blocs matériels dédiés sur une seule puce, ou par plusieurs puces communiquant entre elles pour exécuter différentes phases du calcul. L'équipe a fabriqué et testé un générateur de nombres aléatoires expérimental à base de transistors, qui s'est montré robuste face aux variations simulées du processus de fabrication.
Pour valider les performances, les chercheurs ont simulé cette architecture via un GPU et intégré des données mesurées du générateur de nombres aléatoires physique. Les tests de référence sur l'ensemble de données d'images Fashion-MNIST montrent que l'architecture génère des images de qualité comparable à celles obtenues avec un GPU, mais avec une consommation énergétique estimée à seulement un dix-millième de celle de ce dernier par échantillon généré. De plus, une approche hybride combinant un réseau neuronal traditionnel et un matériel thermodynamique a montré un potentiel sur l'ensemble de données CIFAR-10, utilisant un nombre de paramètres de réseau neuronal dix fois inférieur à celui des réseaux antagonistes génératifs traditionnels, ce qui pourrait permettre une répartition plus pratique des tâches de calcul entre différents sous-systèmes.
Bien que les résultats soient encourageants, l'équipe de recherche souligne des limites. Actuellement, seul le générateur de nombres aléatoires à base de transistors a été validé physiquement ; l'architecture de calcul complète en est encore au stade de la simulation théorique. Les ensembles de données d'images utilisés pour les tests de référence sont bien moins complexes que les grands modèles de langage modernes ou les modèles génératifs avancés. La manière d'étendre efficacement le système au traitement de données plus complexes reste un défi central pour le calcul probabiliste. L'équipe estime que les progrès futurs dépendront probablement davantage d'une intégration profonde entre le matériel probabiliste et les réseaux neuronaux traditionnels, plutôt que d'un remplacement complet des accélérateurs d'IA existants. Cette étude doit être considérée comme un « premier pas » méritant des investissements et des explorations supplémentaires.










