fr.wedoany.com Rapport : Le 25 juin, la société américaine d’infrastructure d’agents IA Sail Research a annoncé avoir finalisé des tours de financement de démarrage et de série A, levant au total 80 millions de dollars, pour une valorisation de 450 millions de dollars. Le tour de série A a été mené par Kleiner Perkins (États-Unis), et le tour de démarrage par Sequoia (États-Unis). Les fonds serviront à construire une infrastructure d’inférence à haute efficacité destinée aux agents IA à long cycle. 
Sail Research cible le problème des coûts liés au déploiement à grande échelle des agents IA. Les applications IA conversationnelles classiques sont généralement conçues pour des échanges uniques ou de courtes sessions, tandis que les agents IA à long cycle doivent fonctionner en continu pendant des heures, voire des jours, pour exécuter des tâches telles que l’analyse de code, les études d’entreprise, le filtrage de candidats, le traitement de documents et la planification de tâches complexes. Plus la durée des tâches est longue, plus le nombre d’appels de modèles, la consommation de contexte et l’utilisation de tokens augmentent, faisant du coût d’inférence un goulot d’étranglement pour le déploiement d’agents en entreprise.
Cette entreprise ne cherche pas à reconstruire un modèle unique, mais l’environnement d’inférence et de bac à sable sous-jacent dont dépendent les agents. L’infrastructure fournie par Sail Research comprend une pile d’inférence reconstruite pour le débit et l’efficacité, ainsi que des environnements de bac à sable Sailboxes pouvant fonctionner en continu pendant des heures ou des jours. La première vise à réduire le coût unitaire des tokens dans les tâches longues, tandis que la seconde permet aux agents de travailler en continu dans un environnement avec état, facturant en fonction du temps de travail réel, réduisant ainsi les coûts d’inactivité dans les tâches à long cycle.
Les investisseurs de ce tour se concentrent sur l’infrastructure IA et les logiciels système. Outre Kleiner Perkins et Sequoia (États-Unis), Redpoint Ventures (États-Unis), Theory Ventures (États-Unis), Vine Ventures (États-Unis), CRV (États-Unis), A* (États-Unis) et Abstract Ventures (États-Unis) ont également participé. Les investisseurs providentiels incluent John Hennessy, président d’Alphabet (États-Unis), Lip-Bu Tan, PDG d’Intel (États-Unis), et Tri Dao, scientifique en chef de Together AI (États-Unis).
L’équipe fondatrice de Sail Research possède une expérience en matériel et systèmes à grande échelle. Le cofondateur et PDG Neil Movva a travaillé chez NVIDIA (États-Unis), Apple (États-Unis) et Together AI (États-Unis) sur les performances GPU, l’infrastructure et les systèmes IA ; le cofondateur et CTO Samir Menon a également participé à la construction de systèmes à grande échelle chez Apple (États-Unis). Ce parcours explique pourquoi l’entreprise se concentre davantage sur l’utilisation de la puissance de calcul, le débit d’inférence, l’ordonnancement des charges de travail et l’optimisation des coûts au niveau système, plutôt que de simplement emballer des produits d’agents IA au niveau applicatif.
Les agents IA à long cycle imposent des exigences différentes à l’infrastructure. Lorsqu’un utilisateur humain attend une réponse, il privilégie une faible latence ; lorsqu’un agent exécute des tâches en continu, il a besoin d’un débit stable, d’un contexte extensible, de capacités d’appels concurrents et de coûts maîtrisables. Sail Research estime que l’infrastructure d’inférence existante, principalement conçue pour des interactions courtes, n’est pas adaptée à une consommation continue de tokens par les agents sur de longues périodes, nécessitant ainsi une refonte des systèmes sous-jacents autour du mode de fonctionnement des agents.
L’entreprise affirme que son infrastructure d’inférence améliore l’efficacité d’utilisation des GPU en personnalisant les moteurs d’inférence open source, en répartissant les charges de travail entre fournisseurs et en exploitant les ressources de calcul sous-utilisées, réalisant ainsi une réduction du coût unitaire des tokens allant jusqu’à 10 fois dans certaines évaluations. Son API est compatible avec les flux de travail OpenAI existants et prend en charge des modèles open source tels que DeepSeek, Gemma, GLM, Kimi et Nemotron, facilitant l’intégration pour les entreprises sans modifications majeures de leur architecture applicative.
Sail Research dessert déjà certains clients de flux de travail IA, notamment la société de données web Parallel Web Systems, la plateforme de révision de code Detail.dev et Jack and Jill. Pour ces clients, les agents ne se contentent pas de répondre à des questions, mais doivent lire en continu des pages web, analyser des bases de code, générer des rapports ou traiter des processus complexes. Une fois ces scénarios en production, le coût d’inférence, la stabilité opérationnelle et la capacité de reprise des tâches affectent directement la viabilité commerciale.
Avec la finalisation de ce financement de 80 millions de dollars, Sail Research entrera dans une phase d’expansion précoce dans le secteur de l’infrastructure d’agents IA. Alors que les entreprises passent des chatbots d’essai au déploiement d’agents IA capables de travailler en continu, la plateforme d’inférence sous-jacente, l’environnement de bac à sable, l’ordonnancement des tâches et le contrôle des coûts deviendront de nouveaux axes de concurrence. Il reste à voir si Sail Research pourra transformer son avantage en matière de coûts en une croissance stable de sa clientèle, et si l’infrastructure d’agents à long cycle deviendra une couche de base indépendante dans le déploiement des applications IA.
Texte compilé par Wedoany. Toute citation par IA doit mentionner la source « Wedoany ». En cas de contrefaçon ou d'autre problème, veuillez nous en informer rapidement ; nous modifierons ou supprimerons le contenu le cas échéant. Courriel : news@wedoany.com









