Micron (États-Unis) dévoile une combinaison de stockage IA, avec HBM4 et SSD de 245 To en production de masse pour soutenir l'inférence des centres de données

2026-06-03 14:53

Favoris

fr.wedoany.com Rapport : Le 1er juin, Micron Technology (États-Unis) a présenté, lors du COMPUTEX 2026, un portefeuille de produits de mémoire et de stockage optimisé pour l'IA, de bout en bout, couvrant les applications allant des centres de données à l'edge computing intelligent. Ce portefeuille comprend HBM4, SOCAMM2, DDR5 RDIMM, des SSD pour centres de données, ainsi que des solutions de stockage pour PC IA, l'automobile et les systèmes embarqués, répondant principalement aux besoins de calcul qui passent de l'entraînement de modèles à l'inférence à grande échelle, aux contextes longs et aux charges de travail d'agents intelligents.

Le message clé de cette annonce de Micron est que le goulot d'étranglement de l'infrastructure IA ne se limite plus à la simple expansion de la puissance de calcul, mais évolue vers une synergie entre la bande passante mémoire, la capacité, la consommation d'énergie et la hiérarchie de stockage. La société a révélé que le HBM4 36 Go 12H, avec une bande passante doublée, peut améliorer le débit d'inférence des grands modèles de langage de 2,6 fois ; le SOCAMM2 de 256 Go est destiné aux applications mémoire des centres de données à faible consommation, offrant une capacité de 256 Go, avec environ un tiers de la consommation d'énergie et un tiers de l'encombrement par rapport aux RDIMM standard ; le DDR5 RDIMM de 256 Go basé sur la technologie 1γ a commencé l'échantillonnage, avec une vitesse maximale de 9200 MT/s, soit 40 % plus rapide que les modules actuellement en production, et réduit la consommation d'énergie de plus de 40 % par rapport à une combinaison de deux modules de 128 Go.

Les SSD pour centres de données constituent également une partie importante de cette combinaison. Micron indique que le Micron 9650 SSD est le premier SSD PCIe Gen6 commercial au monde, destiné aux charges de travail d'inférence et d'entraînement IA ; le Micron 6600 ION est désormais disponible avec une capacité maximale de 245 To, réduisant de 82 % l'espace rack par rapport aux déploiements basés sur des disques durs, et divisant par deux la consommation d'énergie. Pour les centres de données IA, la couche de stockage n'est plus un simple emplacement statique pour les modèles et les données, mais une couche de travail active étroitement liée au cache KV, au lac de données, à la préparation des données d'entraînement et au fonctionnement continu des services d'inférence.

Cette gamme de produits montre que la construction d'infrastructures IA entre dans une phase de « restructuration complète de la mémoire et du stockage ». Les premières constructions IA se concentraient davantage sur le nombre de GPU et les pics de puissance de calcul. Cependant, avec l'ampleur croissante des services d'inférence, les entreprises doivent gérer des contextes plus longs, des demandes de concurrence plus élevées, des tâches d'agents plus complexes et une pression d'accès aux données plus importante. Une bande passante mémoire insuffisante limite la vitesse de réponse des modèles, une capacité insuffisante affecte la planification des contextes longs et des tâches multiples, et des performances de stockage insuffisantes ralentissent le chargement des données, l'appel au cache et le pipeline d'inférence. En présentant HBM, LPDDR, DDR, SOCAMM et SSD dans une même couche d'infrastructure IA, Micron reflète le passage des fabricants de mémoire de fournisseurs de composants individuels à des acteurs clés dans l'optimisation des performances des systèmes IA.

Des changements se produisent également du côté de l'edge computing. Micron souligne qu'avec l'extension de l'inférence IA des centres de données aux PC, smartphones, automobiles et systèmes embarqués, les appareils locaux ont besoin de DRAM de plus haute densité pour maintenir les modèles et les agents en fonctionnement, ainsi que d'un stockage plus rapide et plus fiable pour prendre en charge le cache local des modèles, la fusion de capteurs en temps réel dans les véhicules et les réponses en périphérie. Pour l'industrie des technologies de l'information et de la communication, cela signifie que l'infrastructure IA s'étendra simultanément vers le cloud et l'edge, et que le choix du stockage et de la mémoire affectera directement la vitesse de réponse, la consommation d'énergie et les coûts de déploiement des applications IA.

Micron organisera une exposition de produits sur invitation du 2 au 4 juin à son bureau du TFC Plaza à Taipei. Les variables ultérieures se concentrent sur la progression de l'adoption par les clients du HBM4, du SOCAMM2 et des SSD à haute capacité, l'échelle de production de masse, la vitesse d'adaptation aux plateformes GPU et serveurs, ainsi que la capacité des clients des centres de données à améliorer l'efficacité globale de production de tokens grâce aux mises à niveau de la mémoire et du stockage. Alors que les applications IA passent des clusters d'entraînement aux services d'inférence continus, la mémoire et le stockage deviennent une nouvelle ligne de concurrence clé, en plus du réseau, de la puissance de calcul et de l'énergie des centres de données.

Texte compilé par Wedoany. Toute citation par IA doit mentionner la source « Wedoany ». En cas de contrefaçon ou d'autre problème, veuillez nous en informer rapidement ; nous modifierons ou supprimerons le contenu le cas échéant. Courriel : news@wedoany.com