CIQ lance l’environnement AI Fuzzball pour le NVIDIA DGX Spark

2026-07-01 10:20

Favoris

fr.wedoany.com Rapport : CIQ annonce que sa plateforme Fuzzball est désormais disponible en tant qu’environnement de calcul et d’inférence AI prêt pour la production pour le NVIDIA DGX Spark. Le DGX Spark est la première plateforme prise en charge, d’autres suivront. Les équipes AI peuvent bénéficier d’un environnement cohérent sur leur propre infrastructure contrôlée pour développer, ajuster et déployer des charges de travail, cet environnement fonctionnant de manière identique d’un seul DGX Spark à de grands clusters GPU et centres de données, sans nécessiter de reconstruction lors de l’extension du calcul.

Avant la mise en production d’un modèle, les équipes AI passent des mois à assembler manuellement le stockage, les registres de conteneurs, les ordonnanceurs, les serveurs d’inférence et les pipelines de déploiement. Chaque changement de l’environnement de calcul sous-jacent les oblige à recommencer, retardant le déploiement et la monétisation des charges de travail en raison des mises à niveau de l’infrastructure. Fuzzball remplace ce travail par un environnement de calcul et d’inférence AI prêt à l’emploi, spécialement conçu pour l’inférence locale privée sur le DGX Spark. Pour les organisations construisant des charges de travail AI souveraines (où les données ne doivent pas quitter le site local), cela offre un chemin allant de l’ajustement privé des modèles à l’inférence de production, tout en maintenant le contrôle de l’infrastructure sous-jacente, réduisant le temps nécessaire pour passer de la conception d’un modèle à l’exécution d’un service d’inférence de plusieurs mois à quelques jours.

Gregory Kurtzer, PDG et fondateur de CIQ, et fondateur de Rocky Linux, déclare que Fuzzball est le Kubernetes du calcul intensif en performance et ce dont les équipes AI ont besoin pour véritablement posséder leur infrastructure. La difficulté de l’IA ne réside pas dans le modèle lui-même, mais dans l’exécution de ce modèle à grande échelle sans avoir à reconstruire l’infrastructure sous-jacente en raison des changements de calcul. La plupart des équipes passent des mois à résoudre ce problème avant la mise en production de leur première charge de travail ; Fuzzball met fin à tout cela. Grâce à des centaines de modèles de workflows intégrés, un seul DGX Spark constitue dès le premier jour un environnement complet de développement, test et validation AI, et ces workflows peuvent fonctionner sans modification sur des milliers de systèmes et GPU. CIQ représente le Contrôle de l’Intelligence (Controlling Intelligence), et Fuzzball est la manière dont les équipes atteignent cet objectif.

Avec Fuzzball, un seul DGX Spark devient dès le premier jour un environnement opérationnel de développement et de déploiement AI, capable de s’étendre directement à une infrastructure plus grande selon les besoins du projet. Plusieurs systèmes DGX Spark peuvent fonctionner ensemble dans un environnement Fuzzball unifié, offrant aux petites équipes un moyen pratique d’étendre progressivement leur capacité de calcul locale. Lorsque les charges de travail dépassent la capacité locale, les mêmes conteneurs, actifs de modèles et définitions de workflows peuvent être transférés de manière transparente vers des déploiements GPU NVIDIA plus importants, permettant aux utilisateurs de passer du NVIDIA DGX Spark au NVIDIA GB300 NVL72 sans modifier l’application, le modèle d’orchestration Fuzzball ou le processus de déploiement Fuzzball.

Pour les équipes AI et HPC qui géraient auparavant des chaînes d’outils indépendantes, Fuzzball élimine la fragmentation opérationnelle qui entrave le passage de l’IA de l’expérimentation à la production. La plateforme relie les systèmes DGX Spark locaux et les clusters HPC existants à la capacité cloud et à l’infrastructure GPU, y compris les systèmes GPU NVIDIA, le tout sous un modèle opérationnel unique. Le résultat est une nouvelle génération de calcul accéléré où l’orchestration basée sur les tâches, la portabilité des workflows, l’exécution conteneurisée et l’inférence de production fonctionnent ensemble.

Bjorn Hovland, président de CIQ, souligne que les organisations des secteurs réglementés doivent choisir entre mettre l’IA en production et conserver les données sur une infrastructure contrôlée ; Fuzzball élimine ce compromis. Les équipes peuvent ajuster des modèles en privé sur le DGX Spark, exploiter ces modèles comme services d’inférence de production et les étendre à une infrastructure contrôlée plus grande, sans modifier l’environnement sous-jacent. Pour que l’IA souveraine soit viable, elle doit fonctionner de la même manière à chaque niveau de calcul, et c’est exactement ce que Fuzzball offre sur le DGX Spark. Le DGX Spark est la première plateforme à exécuter cette fonctionnalité, mais ce ne sera pas la dernière.