Pour améliorer l'efficacité des centres de données, les périphériques de stockage sont souvent regroupés et partagés via le réseau, mais les différences de performances entraînent une sous-utilisation de la capacité. Des chercheurs du MIT ont développé un système logiciel nommé Sandook, capable de traiter simultanément trois sources majeures de disparités de performances, améliorant significativement les performances des périphériques de stockage. Comparé aux méthodes traditionnelles qui ne s'attaquent qu'à une seule source de disparité à la fois, le nouveau système offre une augmentation notable de la vitesse.
Sandook adopte une architecture à deux niveaux : un contrôleur central est responsable de l'attribution macroscopique des tâches, tandis que des contrôleurs locaux redirigent rapidement les données lorsque les périphériques rencontrent des difficultés. Le système peut s'adapter en temps réel aux charges de travail changeantes, sans nécessiter de matériel dédié. Lors de tests sur des tâches pratiques telles que l'entraînement de modèles d'intelligence artificielle et la compression d'images, les performances se sont avérées près du double de celles des méthodes traditionnelles.
Gohar Chaudhry, doctorante en génie électrique et informatique (EECS) et auteure principale de l'article, déclare : « Les gens ont tendance à ajouter plus de ressources pour résoudre les problèmes, mais cela n'est pas durable à bien des égards. Nous voulons maximiser la durée de vie de ces ressources coûteuses et à forte intensité carbone. Avec une solution logicielle adaptative, vous pouvez encore extraire beaucoup de performances de votre équipement existant avant de devoir le remplacer. »
Le système Sandook optimise les performances des pools de disques SSD en ciblant les disparités provenant de l'âge des périphériques, de l'usure, des différences de capacité, des interférences entre opérations de lecture/écriture et des processus de récupération de mémoire (garbage collection). Grâce à une planification globale et des réponses locales, le système peut ajuster dynamiquement la charge de travail, améliorant ainsi l'efficacité globale.
Les chercheurs ont testé Sandook sur un pool de 10 SSD, évaluant quatre tâches : l'exécution de bases de données, l'entraînement de modèles de machine learning, la compression d'images et le stockage de données utilisateurs. Par rapport à une méthode statique, Sandook a augmenté le débit de chaque application de 12 % à 94 % et a amélioré l'utilisation globale de la capacité des SSD de 23 %. Le système permet aux SSD d'atteindre 95 % de leur performance théorique maximale, sans mise à jour matérielle.
Cette recherche a été réalisée par l'équipe du MIT. L'article sera présenté lors du symposium USENIX sur la conception et l'implémentation de systèmes en réseau (NSDI 2026), qui se tiendra du 4 au 6 mai 2026 à Renton, dans l'État de Washington. À l'avenir, les chercheurs prévoient d'intégrer les derniers protocoles SSD et d'exploiter la prévisibilité des charges de travail d'IA pour améliorer encore l'efficacité.
Détails de la publication : Auteur : Adam Zewe, Massachusetts Institute of Technology ; Titre : « New software may nearly double pooled SSD performance in data centers ».












