fr.wedoany.com Rapport : Le 1er juin, Aible, une entreprise américaine spécialisée dans l’intelligence artificielle agentique pour les entreprises, a annoncé que sa solution destinée aux agents IA réglementés et à long terme, AibleClaw, est désormais intégrée à NVIDIA Cloud Functions (NVCF), introduisant un modèle économique de GPU sans serveur pour les charges de travail d’IA d’entreprise planifiées. Aible indique que cette intégration permet d’étendre l’avantage de coût total de possession (TCO) de l’IA générative de bout en bout, jusqu’à 200 fois supérieur selon ses précédents benchmarks, aux tâches agentiques d’entreprise à long terme.
AibleClaw cible les agents à long terme que les entreprises déploient de manière accélérée, c’est-à-dire les charges de travail d’IA qui doivent exécuter des tâches en continu ou à intervalles réguliers en arrière-plan. Contrairement aux questions-réponses ponctuelles ou aux inférences de courte durée, ces tâches présentent souvent des pics et des creux plus marqués, comme l’analyse programmée d’ordres du jour de réunions, la génération de rapports de travail, l’analyse de données métier, le traitement de pistes clients, le suivi des évolutions de la chaîne d’approvisionnement ou l’exécution de contrôles de conformité. Aible qualifie ces tâches de « Claws », dont les caractéristiques sont les suivantes : elles peuvent durer plusieurs minutes, leur déclenchement est relativement contrôlable, et leur sensibilité à la latence de démarrage à froid est moindre que celle des applications interactives en temps réel. Elles sont donc plus adaptées à une planification à la demande, une inférence élastique et une optimisation des coûts via NVCF. En combinant AibleClaw avec NVCF, les entreprises n’ont plus besoin de maintenir en permanence des clusters GPU allumés pour toutes les tâches agentiques à long terme. Elles peuvent exécuter les tâches planifiées pendant les périodes où la demande en GPU est plus faible ou où les ressources sont plus adaptées, améliorant ainsi l’utilisation de la puissance de calcul et réduisant les coûts d’inactivité dans les déploiements d’IA privés.
Cette solution repose sur la suite logicielle NVIDIA DSX OS. NVCF, en tant que couche API unifiée, permet d’exécuter et de faire évoluer des charges de travail telles que l’inférence, le fine-tuning, le traitement par lots et la simulation sur des clusters Kubernetes, et prend en charge l’auto-scaling, l’isolation multi-locataire et une meilleure utilisation des GPU. Pour Aible, la valeur de NVCF réside dans la couche d’orchestration d’exécution des agents IA d’entreprise : les entreprises peuvent connecter des serveurs privés, des serveurs edge, des supercalculateurs de bureau, les principales plateformes cloud et les ressources des partenaires cloud de NVIDIA au même système de planification, en donnant la priorité à l’exécution locale lorsque les conditions sont favorables, et en distribuant les tâches vers d’autres sites ou en partageant les ressources des centres de données si nécessaire.
AibleClaw intègre également le runtime NVIDIA OpenShell et le blueprint NemoClaw pour prendre en charge les agents réglementés à long terme. La société avait déjà lancé AibleClaw with NVIDIA Nemotron 3 Super pour les agents d’entreprise réglementés à long terme, ainsi que AibleClaw with NVIDIA Nemotron 3 Nano Omni pour l’inférence multimodale en périphérie. Cette intégration avec NVCF permet à AibleClaw d’étendre son champ d’action des capacités des modèles vers la structure de coûts de l’IA d’entreprise, le déploiement privé et les méthodes de planification des ressources. Pour les entreprises qui ont déjà intégré des agents IA dans leurs processus métier, les variables qui influencent réellement le déploiement à grande échelle ne se limitent pas à la qualité des réponses des modèles, mais incluent également l’utilisation des ressources GPU, la volatilité des coûts des tokens, les exigences de résidence des données, les capacités d’audit et les coûts prévisibles des tâches à long terme.
Aible souligne que sa plateforme peut fonctionner dans des environnements tels que les principaux clouds, les serveurs privés, les partenaires cloud de NVIDIA, les supercalculateurs de bureau et les serveurs edge, et prend en charge l’exécution privée de charges de travail d’IA générative et agentique sur les serveurs propres des entreprises. Cela signifie que les entreprises peuvent intégrer progressivement des agents IA autour de leur infrastructure informatique existante, sans avoir à construire un centre de données centralisé à grande échelle en une seule fois. Alors que les entreprises passent des démonstrations d’IA aux déploiements en production, le modèle de coût des agents à long terme devient un facteur important dans le choix de l’infrastructure. L’intégration d’AibleClaw avec NVCF reflète également le fait que la compétition en matière d’IA d’entreprise passe de la question « peut-on construire un agent ? » à celle de « peut-on faire fonctionner un agent à long terme à faible coût, de manière gouvernable et vérifiable ? ».
Texte compilé par Wedoany. Toute citation par IA doit mentionner la source « Wedoany ». En cas de contrefaçon ou d'autre problème, veuillez nous en informer rapidement ; nous modifierons ou supprimerons le contenu le cas échéant. Courriel : news@wedoany.com









