Coinbase, une entreprise américaine, adopte des modèles open source chinois, réduisant ses dépenses en IA de près de moitié

2026-06-30 10:51

Favoris

fr.wedoany.com Rapport : La bourse de cryptomonnaies américaine Coinbase a défini des modèles d'IA open source chinois comme option par défaut pour ses ingénieurs, afin de réduire ses coûts d'exploitation en IA, en constante augmentation.

Le PDG de Coinbase, Brian Armstrong, a révélé sur le réseau social X que l'entreprise, via sa passerelle LLM interne, a défini le GLM 5.2 de Zhipu AI et le Kimi K2.7 de Moonshot AI comme modèles de langage par défaut pour l'ensemble de ses ingénieurs.

Le PDG de Coinbase, Brian Armstrong, a déclaré avoir défini GLM 5.2 et Kimi K2.7 comme modèles par défaut pour tous les ingénieurs via la passerelle LLM interne

Armstrong a indiqué qu'en changeant le modèle par défaut, en optimisant le routage et en renforçant la mise en cache, les dépenses en IA de Coinbase ont été réduites de près de moitié, malgré une croissance exponentielle de l'utilisation des tokens. Il a ajouté que toute entreprise pourrait ainsi réduire ses coûts et améliorer son efficacité.

Il a souligné que 91 % des ingénieurs de l'entreprise n'avaient jamais atteint la limite d'utilisation initiale. Cette optimisation des coûts n'a pas réduit le quota de tokens des employés, mais a remplacé le modèle par défaut pour les tâches courantes telles que la révision de code et la synthèse de documents, passant des modèles de pointe d'Anthropic et OpenAI aux deux modèles open source chinois susmentionnés.

Le GLM 5.2 est le modèle phare de Zhipu, publié le 12 juin avec des poids ouverts sous licence MIT. Sur la plateforme d'évaluation tierce Artificial Analysis, ce modèle est devenu le modèle open source avec les poids les mieux notés et s'est classé parmi les meilleurs mondiaux. Le GLM 5.2 surpasse le GPT-5.5 d'OpenAI sur des indicateurs tels que SWE-bench Pro et se rapproche de l'Opus 4.8 d'Anthropic sur des tâches comme FrontierSWE. Son coût d'appel ne représente qu'une fraction de celui de l'Opus 4.8.

Le modèle Kimi de Moonshot AI a également récemment attiré l'attention sur les marchés étrangers. En mars dernier, l'outil américain de programmation IA Cursor, racheté par Elon Musk pour 60 milliards de dollars, a été accusé d'avoir « habillé » son modèle propriétaire Composer 2 avec le modèle Kimi K2.5. Le revenu annuel récurrent (ARR) de Moonshot AI est passé d'environ 100 millions de dollars en mars à plus de 200 millions de dollars en avril, et ses revenus API à l'étranger ont quadruplé depuis novembre dernier, tandis que sa valorisation est passée de 4,3 milliards à 20 milliards de dollars en six mois. Le Kimi K2.7 Code utilisé par Coinbase est le dernier modèle de code publié par Moonshot AI le 12 juin.

Le cas de Coinbase n'est pas isolé. Alors que les dépenses en IA des entreprises américaines deviennent généralement incontrôlables, de plus en plus d'entreprises américaines transfèrent leurs charges vers des modèles open source chinois. L'année dernière, Airbnb a remplacé son modèle de service client de GPT à Qwen. Récemment, la société américaine d'IA Lindy a migré son modèle d'Anthropic Claude vers DeepSeek V4, après que ses dépenses en IA aient dépassé la masse salariale totale. Le PDG de Snowflake estime que le GLM 5.2 peut offrir des performances équivalentes à celles de Claude à un prix inférieur.

Un rapport de mars de la Commission d'examen économique et de sécurité entre les États-Unis et la Chine (U.S.-China Economic and Security Review Commission) estime qu'environ 80 % des startups américaines d'IA utilisent des modèles open source chinois. Sur la plateforme OpenRouter, la part des tokens des modèles chinois est passée de moins de 2 % il y a un an à plus de 40 % en avril de cette année. Les téléchargements cumulés de la série Qwen d'Alibaba ont dépassé les 700 millions en janvier de cette année, dépassant ceux de Llama de Meta sur Hugging Face, devenant ainsi l'une des familles de modèles open source les plus téléchargées au monde.

Sur la plateforme OpenRouter, qui présente les appels de grands modèles d'IA, les grands modèles chinois occupent depuis longtemps la première place du classement.

Les frictions entre la Chine et les États-Unis dans le domaine de l'IA se poursuivent également. Zhipu a été inscrit sur la liste des entités par le Département du commerce américain en janvier 2025, sous prétexte de « contribuer à la modernisation militaire chinoise », devenant ainsi la première entreprise chinoise de grands modèles à figurer sur cette liste. Moonshot AI a été accusée publiquement par Anthropic en février de cette année d'avoir « distillé » Claude via des comptes fictifs avec DeepSeek et MiniMax. En juin, Anthropic a accusé l'équipe Qwen d'Alibaba d'avoir lancé une distillation à plus grande échelle.

En ce qui concerne les problèmes de conformité liés à la sécurité des données et à la sécurité nationale, Coinbase a déclaré avoir téléchargé les poids open source sur ses propres serveurs pour une exécution auto-hébergée, garantissant que le code et les questions ne transitent pas par des interfaces API situées en Chine.

Le transfert des charges de travail d'ingénierie des entreprises vers des modèles open source chinois exerce une pression sur les prix des fournisseurs occidentaux de pointe. Anthropic a déposé confidentiellement son introduction en bourse auprès de la Securities and Exchange Commission américaine le 1er juin, la valorisation de son marché dépendant principalement de la croissance rapide des paiements des entreprises. Le transfert massif des charges quotidiennes des entreprises vers des modèles open source chinois moins chers pourrait être considéré comme un risque central pour son récit de croissance.

Goldman Sachs estime que la consommation mondiale de tokens pourrait être multipliée par 24 d'ici 2030. Dans un contexte où les prix des fournisseurs américains fermés comme OpenAI et Anthropic restent élevés, si le coût par token ne diminue pas, la pression sur les factures des entreprises continuera d'augmenter. Les interdictions de GPT 5.6 et Claude Fable 5 ont également fait de la disponibilité des modèles une question centrale pour les entreprises.

Chine

États-Unis

Information et communication Ingénierie de l'intelligence artificielle

Ce texte est rédigé, traduit et republié à partir des informations de l'Internet mondial et de partenaires stratégiques, uniquement pour la communication entre lecteurs. En cas d'infraction au droit d'auteur ou d'autres problèmes, veuillez nous en informer à temps pour la modification ou la suppression. La reproduction de cet article est strictement interdite sans autorisation formelle. Mail : news@wedoany.com

Préc：La société chinoise GeoChip Technology expose la puce GC080X au MWC, ciblant le secteur aérospatial

Suiv：La plateforme AIoT de China Mobile IoT obtient l’évaluation de niveau Excellence 5.0 de l’Internet des objets intelligent par l’Académie chinoise des technologies de l’information et de la communication