Saturn Cloud lance la plateforme Token Factory pour les opérateurs de cloud GPU aux États-Unis

2026-06-10 11:49

Favoris

fr.wedoany.com Rapport : Saturn Cloud, plateforme de développement IA destinée aux opérateurs de cloud GPU, lance Token Factory, permettant aux équipes IA des entreprises d’effectuer l’intégralité du processus de fine-tuning et de service d’inférence sur l’infrastructure GPU des opérateurs. Cette plateforme permet aux opérateurs neocloud, aux constructeurs d’usines IA et aux entreprises de proposer à leurs clients des tâches de fine-tuning hébergées, une gestion des jeux de données et des points de terminaison d’inférence compatibles avec OpenAI, le tout facturé au token, livré sous la marque de l’opérateur, sans nécessité de développement ou de maintenance de composants.

Les opérateurs de cloud GPU investissent massivement dans l’infrastructure d’accélération, avec des déploiements à grande échelle des systèmes NVIDIA Grace Blackwell, NVIDIA Blackwell et NVIDIA Hopper, et une croissance rapide des revenus des activités neocloud. Cependant, de nombreux opérateurs limitent encore leur modèle économique à la location de puissance de calcul GPU à l’heure. Les besoins des entreprises clientes dépassent désormais la simple fourniture de puissance de calcul : elles exigent des environnements de développement hébergés, une orchestration de l’entraînement distribué, des pipelines de fine-tuning, l’authentification unique (SSO) et le contrôle d’accès basé sur les rôles (RBAC), le suivi d’utilisation et des outils de conformité. La plupart des opérateurs de cloud GPU manquent de ressources humaines pour construire en interne ces infrastructures de plateforme, ce qui nécessite généralement plusieurs mois de développement et de maintenance continue.

Sebastian Metti, fondateur de Saturn Cloud, déclare que les opérateurs ne devraient pas avoir à construire une plateforme de développement IA à partir de zéro pour rendre l’infrastructure GPU accessible aux équipes d’entreprise. Saturn Cloud propose dès le départ des environnements hébergés, une orchestration de l’entraînement, le fine-tuning, des points de terminaison d’inférence compatibles avec OpenAI et une facturation au token.

La plateforme Token Factory permet aux équipes IA de fine-tuner et de servir des modèles ouverts sans gérer l’infrastructure. Les utilisateurs n’ont qu’à télécharger des jeux de données, configurer des tâches de fine-tuning et déployer les modèles générés sur des points de terminaison d’inférence, le tout dans l’environnement de marque de l’opérateur. Les tâches de fine-tuning prennent en charge le fine-tuning supervisé (poids complets et LoRA) sur des modèles ouverts. Lorsque l’instance sélectionnée est équipée de plusieurs GPU, le système configure automatiquement DeepSpeed pour le multi-GPU. L’utilisateur spécifie le modèle de base, le jeu de données et quelques hyperparamètres, et Saturn Cloud génère la configuration d’entraînement complète, en gérant l’orchestration, les tentatives et les points de contrôle. Les frameworks d’entraînement pris en charge incluent Axolotl, vLLM, Unsloth, TRL, PEFT et DeepSpeed.

Les jeux de données sont des collections typées et validées de données d’entraînement, aux formats conversationnel, instructif, textuel ou pré-tokenisé. Les utilisateurs peuvent télécharger directement des jeux de données, les importer depuis des sources externes (comme S3, NFS) ou les organiser dans un espace de travail hébergé, puis les enregistrer en tant que jeux de données Token Factory. Tous les stockages de jeux de données utilisent un système de fichiers parallèle haute performance plutôt qu’un stockage objet, afin d’éliminer les surcoûts de démarrage à froid et d’éviter une baisse de l’utilisation du GPU pendant l’entraînement.

La lignée des points de contrôle et des artefacts est gérée automatiquement. Une fois la tâche de fine-tuning terminée, les points de contrôle générés sont enregistrés dans le registre d’artefacts de Saturn Cloud, conservant la lignée complète de l’exécution de l’entraînement aux poids du modèle. Les points de contrôle peuvent être immédiatement utilisés comme entrée pour le déploiement de points de terminaison d’inférence. Les points de terminaison d’inférence déploient les modèles fine-tunés ou de base en tant que points de terminaison de service persistants, soutenus en backend par vLLM, chaque déploiement disposant d’un sous-domaine indépendant, d’une surveillance de l’état et d’une mesure au token. La configuration du service (comme dtype, longueur de contexte maximale, quantification) est générée au moment du déploiement, sans nécessité de scripts de service personnalisés. L’ensemble du flux de travail est isolé par organisation, les ressources Token Factory étant limitées au périmètre du locataire, garantissant que les jeux de données, points de contrôle et points de terminaison d’un client ne sont pas visibles par d’autres clients.

Saturn Cloud offre aux opérateurs de cloud GPU un chemin clé en main de l’infrastructure bare metal à une plateforme IA génératrice de revenus. La couche fonctionnelle destinée aux opérateurs comprend la marque blanche, la facturation au token et à l’heure GPU, l’intégration et l’auto-provisionnement des locataires, les tableaux de bord d’utilisation et les rapports de facturation, ainsi que les outils de sécurité d’entreprise (SSO, RBAC et conformité SOC 2). Sans cette couche plateforme, les opérateurs ne peuvent vendre que du temps de calcul, tombant dans une guerre des prix ; avec Saturn Cloud, ils peuvent vendre une plateforme, en concurrençant sur l’expérience développeur, la posture de sécurité et le délai de mise sur le marché. La plateforme permet aux opérateurs de passer les audits de sécurité d’entreprise, car les outils de conformité sont déjà en place, tout en leur permettant d’afficher des panneaux d’utilisation, un contrôle des coûts et une gestion d’équipe pour les locataires, et de fournir à leurs équipes commerciales des démonstrations produit plutôt que des fiches techniques.

Les équipes IA et les développeurs travaillant sur l’infrastructure des opérateurs bénéficient d’environnements de développement hébergés (avec accès à JupyterLab, VS Code, RStudio et SSH), d’un entraînement distribué multi-GPU (avec orchestration, tentatives et journaux), de Token Factory pour le fine-tuning et le service de modèles ouverts, ainsi que d’un support préconfiguré pour NVIDIA CUDA, les pilotes GPU et les frameworks IA. Les ingénieurs peuvent utiliser l’ensemble du cluster GPU de l’opérateur, y compris les systèmes NVIDIA Hopper, Blackwell et Blackwell Ultra, ainsi que le système rack NVIDIA GB200 NVL72. Saturn Cloud est membre du programme NVIDIA Inception.

Saturn Cloud s’intègre avec des partenaires d’automatisation d’infrastructure de l’écosystème, notamment Mirantis k0rdent AI, Spectro Cloud, OpenNebula et Rafay. Les opérateurs qui gèrent Kubernetes directement dans le backend cloud peuvent également déployer Saturn Cloud au-dessus de leur pile existante, sans modifier la couche d’infrastructure.

Les fonctionnalités de Token Factory sont désormais disponibles pour les opérateurs de cloud GPU, les neocloud et les entreprises exploitant leur propre infrastructure GPU. Les organisations intéressées par le déploiement de cette plateforme peuvent contacter Saturn Cloud pour une évaluation.

Saturn Cloud est une plateforme de token factory IA destinée aux neocloud, aux opérateurs d’usines IA et aux entreprises, offrant le fine-tuning hébergé, le service de modèles compatible OpenAI (facturé au token), les environnements hébergés, l’entraînement distribué et la sécurité et la gouvernance d’entreprise. La plateforme prend en charge plusieurs architectures GPU et peut être déployée dans des environnements cloud public, cloud privé et sur site.

Texte compilé par Wedoany. Toute citation par IA doit mentionner la source « Wedoany ». En cas de contrefaçon ou d'autre problème, veuillez nous en informer rapidement ; nous modifierons ou supprimerons le contenu le cas échéant. Courriel : news@wedoany.com