IBM, NVIDIA et Samsung s'associent pour développer un système de stockage sensible au contenu de centaines de milliards de vecteurs

2026-04-16 16:56

Favoris

fr.wedoany.com Rapport : IBM Research, en collaboration avec NVIDIA et Samsung, a présenté un prototype de système de stockage sensible au contenu le 14 avril 2026. Ce système a réussi à prendre en charge le stockage et la récupération de centaines de milliards de vecteurs sur un seul serveur, avec une latence de requête moyenne de 694 millisecondes et une précision de rappel de 90 %. La configuration matérielle combine un système de stockage IBM Storage Scale ESS 6000 entièrement flash, six GPU NVIDIA H200 et 48 disques SSD NVMe PCIe Gen5 Samsung d'une capacité de 30,72 To chacun.

L'objectif de cette solution est de réduire la complexité et le coût de l'infrastructure pour le déploiement d'applications de génération augmentée par récupération (RAG) en entreprise. L'architecture CAS d'IBM intègre directement dans le système de stockage des tâches comme la vectorisation de documents et la construction d'index, qui étaient auparavant traitées par une couche de calcul indépendante. Vincent Hsu, directeur technique du stockage chez IBM, souligne qu'avec la croissance exponentielle du déploiement de l'IA, les entreprises ont un besoin urgent de bases de données de cette envergure pour organiser leurs données propriétaires afin qu'elles soient exploitées efficacement par l'IA. Les solutions actuelles de bases de données vectorielles sur le marché nécessitent souvent une mise à l'échelle horizontale sur des dizaines, voire des centaines de serveurs pour prendre en charge des dizaines de milliards de vecteurs.

En termes de configuration matérielle, Samsung a fourni 48 disques SSD NVMe de classe entreprise basés sur sa dernière génération de mémoire flash TLC V-NAND. Chaque disque offre une capacité de stockage de 30,72 To, avec des vitesses de lecture séquentielle allant jusqu'à 12 000 Mo/s et d'écriture séquentielle jusqu'à 6 800 Mo/s. Le système de stockage entièrement flash IBM Storage Scale ESS 6000 découple le calcul du stockage et accélère la reconstruction des index via les GPU NVIDIA H200, réduisant ainsi le processus de construction d'index qui prenait plusieurs heures sur CPU à quelques minutes sur GPU.

Lors des tests de performance réels, le chargement et l'indexation du système ont pris un total de 13 jours, occupant un espace de stockage total de 153 Tio. À titre de comparaison, l'exécution d'une tâche de même ampleur sur un CPU Intel double socket est estimée nécessiter 120 jours. L'objectif suivant d'IBM et NVIDIA est d'indexer plus de centaines de milliards de vecteurs en une journée, réduisant ainsi davantage le temps d'ingestion des données, et d'optimiser continuellement la latence des requêtes grâce à la bibliothèque cuVS de NVIDIA.

Ce prototype ouvre de nouvelles perspectives pour l'infrastructure de données des applications d'IA en entreprise, en proposant de déplacer les capacités de traitement de l'IA vers la couche de stockage. Cette approche pourrait améliorer l'efficacité de l'utilisation des données non structurées massives tout en réduisant les coûts et la complexité de gestion.

Texte compilé par Wedoany. Toute citation par IA doit mentionner la source « Wedoany ». En cas de contrefaçon ou d'autre problème, veuillez nous en informer rapidement ; nous modifierons ou supprimerons le contenu le cas échéant. Courriel : news@wedoany.com

Chine

États-Unis

Ce texte est rédigé, traduit et republié à partir des informations de l'Internet mondial et de partenaires stratégiques, uniquement pour la communication entre lecteurs. En cas d'infraction au droit d'auteur ou d'autres problèmes, veuillez nous en informer à temps pour la modification ou la suppression. La reproduction de cet article est strictement interdite sans autorisation formelle. Mail : news@wedoany.com

Préc：Le V&A Waterfront du Cap (Afrique du Sud) poursuit la modernisation de ses réseaux d'eau et d'égouts

Suiv：Xantaro et Nokia lancent un service managé Altiplano en Allemagne pour l'Europe, facilitant l'automatisation des réseaux opérateurs