fr.wedoany.com Rapport : L’entreprise américaine de puces Qualcomm est en train de transférer l’architecture des puces d’IA des centres de données vers les terminaux tels que les smartphones, les PC et les voitures. Le 27 juin, Durga Malladi, vice-président exécutif de Qualcomm, a déclaré que l’entreprise prévoyait d’appliquer la technologie des puces pour centres de données, récemment dévoilée cette semaine, aux smartphones afin d’améliorer les capacités locales d’exécution de l’IA sur les appareils mobiles. Qualcomm est en pourparlers avec des fabricants de smartphones, de PC et de voitures concernant cette technologie. La première génération de produits basés sur l’architecture de calcul à haute bande passante sera lancée dans les centres de données l’année prochaine, avec une commercialisation prévue pour 2028.
La technologie clé présentée par Qualcomm est l’architecture de calcul à haute bande passante, ou HBC. Contrairement à la conception traditionnelle des puces où les unités de calcul et la mémoire sont disposées côte à côte, elle adopte un empilement vertical des puces, rapprochant ainsi la mémoire des unités de calcul. Grâce au calcul en mémoire proche, elle réduit la distance de transfert des données. Lors de l’exécution d’un modèle d’IA, la puissance de calcul n’est pas le seul goulot d’étranglement ; les paramètres du modèle, les données contextuelles et les résultats intermédiaires doivent circuler fréquemment entre les unités de calcul et la mémoire. Plus la distance de transfert des données est longue, plus la pression sur la bande passante, la latence et la consommation d’énergie sont élevées. C’est ce que l’industrie des puces d’IA appelle souvent le problème du « mur de la mémoire ».
L’architecture HBC vise précisément à résoudre ce goulot d’étranglement. Dans la feuille de route des centres de données, Qualcomm présente la HBC comme une architecture de calcul en mémoire proche destinée aux charges de travail d’IA. Grâce à une solution de silicium empilé en 3D, elle combine étroitement la puissance de calcul avec une mémoire à haute bande passante, afin de réduire la consommation d’énergie par token et d’améliorer l’efficacité du débit de données lors de l’inférence IA. La feuille de route publiée par l’entreprise montre que l’AI250, équipé de la première génération de HBC, commencera l’envoi d’échantillons commerciaux à la mi-2027, tandis que la deuxième génération de HBC sera utilisée pour l’AI300, avec un envoi d’échantillons commerciaux prévu pour 2028.
Contrairement aux centres de données, les smartphones imposent des contraintes plus strictes en matière de consommation d’énergie, de taille, de dissipation thermique et d’autonomie de la batterie pour les puces. Si les grands modèles dépendent à long terme du fonctionnement dans le cloud, les utilisateurs doivent envoyer des requêtes au serveur, ce qui entraîne des problèmes de latence, de connexion réseau, de confidentialité et de coûts de calcul dans le cloud. L’objectif de l’IA sur terminal est de permettre à davantage de modèles de fonctionner directement sur le téléphone localement, notamment les assistants vocaux, la génération d’images, la traduction en temps réel, le résumé de documents, les agents personnels et la compréhension multimodale. Pour atteindre ces capacités, les puces des smartphones doivent traiter des modèles plus grands et effectuer des tâches d’inférence plus fréquentes avec une consommation d’énergie limitée.
En introduisant la technologie HBC des centres de données dans les smartphones, Qualcomm vise à transférer des capacités de déplacement de données à plus haute bande passante et à plus faible consommation d’énergie vers les terminaux. Les puces des smartphones mettaient auparavant l’accent sur les capacités combinées du CPU, du GPU, du NPU, de l’ISP et du modem de communication. À l’ère de l’IA, elles doivent permettre aux modèles locaux de fonctionner en permanence, même lorsque l’utilisateur n’ouvre pas activement une application, pour effectuer des tâches de perception, d’analyse et de notification. Ces « agents permanents » imposent des exigences plus élevées en matière de gestion de la batterie, et les puces doivent maintenir une capacité d’inférence continue sans augmenter significativement la consommation d’énergie.
Malladi a déclaré : « La technologie qui commence dans les centres de données ne s’arrêtera pas là. » Cette phrase reflète le jugement de Qualcomm sur la voie de migration technologique : les centres de données assument d’abord l’inférence IA intensive et la validation de l’architecture, puis, une fois que les processus, l’encapsulation, la synergie mémoire et la pile logicielle sont matures, la technologie s’étend progressivement aux smartphones, PC et terminaux automobiles. Plutôt que d’introduire directement une architecture nouvelle et risquée sur les téléphones, valider d’abord la HBC dans les produits de centres de données permet à Qualcomm d’accumuler de l’expérience en conception, fabrication, dissipation thermique et adaptation logicielle.
Cette voie correspond également à la structure commerciale de Qualcomm. L’entreprise est depuis longtemps spécialisée dans les puces pour smartphones, avec une expertise approfondie dans les SoC à faible consommation, la synergie mémoire LPDDR, la connectivité et l’accélération IA sur terminal. Cette fois, l’activité des centres de données n’est pas complètement séparée de celle des téléphones ; elle étend plutôt les capacités de conception économe en énergie développées à l’ère des puces mobiles à l’infrastructure IA, puis ramène la nouvelle architecture mémoire et de calcul formée dans les centres de données vers les terminaux. Pour Qualcomm, les téléphones, PC, voitures et centres de données passent de marchés distincts à différents nœuds d’un même système de calcul IA.
Du côté des centres de données, Qualcomm a intégré la HBC dans la feuille de route Dragonfly et a simultanément lancé le CPU C1000, l’accélérateur d’inférence AI300 et une gamme de produits de connectivité pour l’infrastructure IA. L’entreprise affirme que la HBC Gen 1, combinée à l’AI250, peut offrir une bande passante mémoire effective de 133 To/s par carte, soit 18 fois plus que la solution LPDDR5X de l’AI200 ; la HBC Gen 2, utilisée dans l’AI300, offre une amélioration de 54 fois par rapport à l’AI200. Qualcomm indique également que la HBC, au niveau de la carte, offre une bande passante par watt 6 fois supérieure à celle des solutions HBM, et au niveau du rack, une capacité par watt 200 fois supérieure à celle des solutions SRAM.
La question de savoir si ces indicateurs peuvent être entièrement transférés aux téléphones dépend du budget énergétique, du coût d’encapsulation, de la capacité de dissipation thermique et de l’écosystème logiciel des produits terminaux. Les smartphones ne peuvent pas simplement copier les spécifications des puces des centres de données, mais ils peuvent absorber les concepts de conception du calcul en mémoire proche, de l’empilement vertical et d’une bande passante mémoire plus serrée. À l’avenir, si les puces des smartphones disposent de capacités de déplacement de données plus efficaces, elles pourront exécuter localement des modèles d’IA plus complexes, réduire la fréquence des appels au cloud et permettre aux assistants IA d’avoir une capacité de réponse en temps réel plus forte dans les domaines de la voix, de l’image, du travail, de la connectivité de conduite et de la gestion des données personnelles.
Cette annonce de Qualcomm montre également que la concurrence dans l’IA sur terminal entre dans une phase architecturale. Par le passé, l’IA sur téléphone dépendait davantage des pics de puissance de calcul du NPU, de la compression des modèles et de l’optimisation logicielle. La prochaine étape se concentrera davantage sur la bande passante mémoire, la structure d’encapsulation, la densité de puissance et la synergie au niveau du système. Si la HBC peut passer des centres de données aux terminaux, les puces des smartphones passeront d’un « accélérateur IA intégré » à une « plateforme de calcul repensée pour les modèles d’IA permanents ». La suite dépendra du moment où Qualcomm clarifiera le calendrier de déploiement sur les téléphones et de la volonté des fabricants de téléphones, PC et voitures d’assumer les coûts de cette nouvelle encapsulation et architecture mémoire.
Texte compilé par Wedoany. Toute citation par IA doit mentionner la source « Wedoany ». En cas de contrefaçon ou d'autre problème, veuillez nous en informer rapidement ; nous modifierons ou supprimerons le contenu le cas échéant. Courriel : news@wedoany.com









