La Fondation Linux crée la Tokenomics Foundation pour faire face à la perte de contrôle des coûts de l’IA

2026-06-06 11:44

Favoris

fr.wedoany.com Rapport : Les entreprises s’inquiètent du coût croissant de l’utilisation de l’IA. Uber avait déjà épuisé son budget de programmation IA pour l’ensemble de l’année 2026 dès le mois d’avril ; Microsoft a retiré les licences permettant aux développeurs d’utiliser Claude Code quelques mois après les avoir accordées ; un employé de Priceline a confié à TechCrunch que le renouvellement de son contrat standard pour Cursor avait augmenté de 4 à 5 fois.

Bien que le prix par token ait baissé, la généralisation des applications d’IA et l’autonomie croissante des agents font grimper la consommation totale de manière spectaculaire. Les entreprises qui avaient souscrit en masse à des forfaits illimités début 2025 s’efforcent aujourd’hui de retrouver la trace de leurs dépenses, de réduire leurs coûts et de tenter de dégager un retour sur investissement face à la pression budgétaire. Parallèlement, un marché répondant au besoin de suivi des coûts est en train d’émerger, où startups, fournisseurs existants et un nouvel organisme de normalisation se disputent la fourniture d’outils et de langages aux entreprises.

« Il y a six mois, les clients demandaient simplement : "Qu’est-ce que ça peut faire ? Est-ce assez bon ?" », a déclaré Alexander Embiricos, responsable des entreprises chez OpenAI, lors d’un événement à New York rapporté par TechCrunch. « Aujourd’hui, la conversation a complètement changé : "Nous dépensons trop, que pouvez-vous nous offrir en termes de visibilité ? Quelles capacités d’audit ? Quels contrôles sur les tokens ? Quelle est l’efficacité de vos modèles ?" »

C’est dans ce contexte que la Fondation Linux a annoncé cette semaine le projet Tokenomics Foundation, un nouvel organisme de normalisation visant à apporter à la dépense en tokens d’IA une discipline comparable au FinOps (discipline de coûts établie pour les dépenses cloud).

« En avril et mai, j’ai commencé à entendre des entreprises dire : "Mon Dieu, nous avons déjà dépassé de trois fois le budget total de tokens pour 2026, et nous ne sommes qu’en avril" », a confié J.R. Storment, directeur exécutif de la FinOps Foundation, une filiale de la Fondation Linux, à TechCrunch. « Nous avons commencé à entendre des crises existentielles. Tout le discours est passé de "maximiser les tokens" et "aller vite" à "nous avons besoin de garde-fous, comment contrôler cela ?" »

Ces appels surviennent après que les PDG ont exigé avec ferveur que leurs équipes utilisent les meilleurs modèles sans se soucier des coûts pour accélérer les projets. Les nouveaux modèles publiés en novembre, comme le Claude Opus 4.5 d’Anthropic, le GPT-5.1 d’OpenAI et le Gemini 3 Pro de Google, ont apporté des améliorations significatives aux outils agents, multipliant la consommation. Selon des rapports, une entreprise a dû faire face à une facture de 500 millions de dollars pour Claude après avoir oublié de fixer des limites d’utilisation pour ses employés.

« C’est comme une épidémie de crack », a déclaré Chris Reed, directeur financier senior IT chez Priceline. Il a souligné que l’entreprise a déjà commencé à imposer des limites de tokens à certains groupes : « Ils vous font goûter au plaisir, vous rendent accro, puis vous êtes piégé. »

Vitaly Gordon, PDG de la plateforme d’ingénierie opérationnelle Faros AI, a indiqué avoir récemment parlé à un directeur technique qui lui a confié : « Un de mes ingénieurs a dépensé 40 000 dollars en tokens le mois dernier. Je ne sais vraiment pas si je dois l’arrêter ou dire aux autres de faire comme lui. »

Une enquête menée par Faros en mars a révélé que, parmi 20 000 développeurs, la production augmentait, mais aussi les bugs et les réécritures. Jellyfish, une plateforme de gestion d’ingénierie, a également constaté que les ingénieurs utilisant le plus de tokens étaient environ deux fois plus productifs que ceux utilisant moins l’IA, mais qu’ils dépensaient 10 fois plus de tokens pour y parvenir.

Nicholas Arcolano, directeur de la recherche chez Jellyfish, a déclaré à TechCrunch par courriel que l’explosion des dépenses en IA était en grande partie due aux fonctions agents, la consommation par développeur ayant augmenté d’environ 18,6 fois en neuf mois. Ces données rendent la correspondance entre l’amélioration de la productivité et la croissance des dépenses encore plus floue. « La question de savoir si les dépenses extrêmes en valent la peine dépend en fin de compte de la valeur commerciale finale du code publié (par exemple, les revenus), et la plupart des entreprises ne peuvent toujours pas la mesurer », a déclaré Arcolano.

Une partie du problème de mesure réside dans l’ampleur actuelle de l’utilisation de l’IA. « Suivre les coûts cloud est un problème de données de centaines de millions de lignes par mois », a déclaré Storment. « Suivre les coûts des tokens est un problème de données de milliers de milliards de lignes par mois. Vous ne pouvez pas simplement fourrer ces données dans un tableur ou même un outil basique. Vous devez repenser fondamentalement vos outils, vos normes et vos systèmes comptables. »

Chez Priceline, Reed a déjà observé des écarts, signalant des problèmes entre les données d’utilisation rapportées par les fournisseurs et les données internes de Priceline. « Ma carrière a commencé dans la gestion des coûts de télécommunications, et je vois toutes les similitudes entre les télécoms, le cloud et l’IA », a-t-il déclaré. « Chaque fois que quelque chose de nouveau est introduit, il y a des erreurs de facturation, ainsi que des opportunités d’audit et d’optimisation. »

Un marché est en train de se former autour de ce problème. Des pure players comme Pay-i peuvent suivre, mesurer et optimiser les coûts et les performances des investissements en IA générative ; Paid permet aux développeurs de suivre les coûts, de mesurer l’utilisation et de facturer les utilisateurs en fonction de la valeur réelle plutôt que d’un abonnement. Il y a aussi des entreprises comme Jellyfish, Waydev et Faros AI, qui proposent une surveillance des agents IA pour justifier le retour sur investissement des outils de développement. Storment a indiqué que la plupart des 180 fournisseurs de la FinOps Foundation se tournent vers ce domaine.

Les entreprises disposant de canaux de distribution existants ajoutent également de nouvelles fonctionnalités. Ramp est récemment entré dans le domaine de la gestion des dépenses en IA ; Datadog et New Relic ont ajouté des services tels que la gestion des coûts cloud, l’observabilité au niveau des tokens et la surveillance des GPU. Lors de la conférence FinOps X de la semaine prochaine, AWS devrait dévoiler de nouvelles fonctionnalités de gestion financière destinées aux dépenses d’IA des entreprises.

Tiffany Luck, associée chez NEA, estime que l’efficacité des tokens et l’observabilité pourraient être intégrées à la « couche de harnais ou à la couche applicative ». Elle a mentionné la startup Factory, qui a lancé cette semaine un routeur de modèles capable de sélectionner automatiquement le modèle approprié pour chaque tâche. Gordon s’attend à ce que les laboratoires de pointe et autres fournisseurs de modèles adoptent une optimisation de type OpenRouter, orientant les requêtes vers les modèles les moins chers – une tendance déjà visible sur les factures Claude des entreprises. « Même si vous appelez le modèle Opus, une partie des coûts sera attribuée à Sonnet ou Haiku », a déclaré Gordon, « car ces derniers sont suffisamment intelligents pour effectuer le travail. Je pense que cela deviendra de plus en plus courant. »

Cependant, tous ces outils sont construits sans langage commun ni définitions partagées. C’est là que la Tokenomics Foundation espère intervenir. La fondation élabore des définitions et des cadres normatifs pour la « tokenomics » ; elle établit des normes, des spécifications et des indicateurs ouverts pour l’utilisation et la facturation des tokens d’IA ; ainsi que de nouveaux indicateurs tels que le coût par intelligence ou le nombre de tokens par watt. Elle prévoit également de définir des indicateurs d’efficacité des usines de tokens et d’efficacité de la consommation. L’organisation prévoit un lancement officiel en juillet et annoncera davantage de membres lors de la conférence FinOps X de la semaine prochaine.

« L’économie des tokens est fondamentalement plus abstraite et opaque que tout ce que nous avons géré à cette échelle auparavant », a déclaré Nishant Gupta, directeur de la disponibilité chez Salesforce, dans un communiqué. « Elle nécessite un muscle opérationnel différent de celui que l’industrie a développé pour le cloud. »

Bien que Goldman Sachs prévoie une multiplication par 24 de l’utilisation mondiale des tokens d’ici 2030, les entreprises qui ont déjà dépassé leur budget ont besoin de solutions immédiates, alors que les premiers résultats de la fondation ne seront pas disponibles avant plusieurs mois. « Nous avons peut-être inventé la machine à vapeur, mais nous n’avons pas encore compris la chaîne de montage », a déclaré Gordon. Selon Arcolano, une adoption large et modérée est la voie la plus sage. « Le meilleur retour sur investissement vient du fait d’amener une large couche intermédiaire d’une utilisation faible à une utilisation moyenne, plutôt que de pousser les utilisateurs intensifs encore plus haut », a-t-il déclaré.

Texte compilé par Wedoany. Toute citation par IA doit mentionner la source « Wedoany ». En cas de contrefaçon ou d'autre problème, veuillez nous en informer rapidement ; nous modifierons ou supprimerons le contenu le cas échéant. Courriel : news@wedoany.com

États-Unis