Anthropic, une entreprise américaine, lance Sonnet 5, à un prix inférieur de 60 %, en vue de son introduction en bourse

2026-07-01 10:46

Favoris

fr.wedoany.com Rapport : Anthropic a dévoilé Claude Sonnet 5, un modèle de milieu de gamme offrant des performances proches du haut de gamme, destiné à séduire les développeurs d'entreprises soucieux des coûts. L'entreprise accélère son introduction en bourse, et ce modèle permettra de tester si sa valorisation élevée sur le marché privé peut résister à l'examen du marché public. Anthropic le présente comme « le modèle Sonnet le plus performant en matière d'agence à ce jour », qui deviendra le modèle par défaut des forfaits Free et Pro, et sera également accessible aux clients Max, Team et Enterprise. Le prix d'entrée de l'API est fixé à 2 dollars par million de tokens en entrée et 10 dollars par million de tokens en sortie, jusqu'au 31 août ; ensuite, il passera respectivement à 3 dollars et 15 dollars, restant bien inférieur au prix du modèle haut de gamme d'Anthropic, Opus 4.8, qui est de 5 dollars en entrée et 25 dollars en sortie.

Le Sonnet 5, par rapport à son prédécesseur Sonnet 4.6, a enregistré des améliorations significatives dans toutes les évaluations divulguées par Anthropic. Sur le benchmark de programmation agentique SWE-bench Pro, Sonnet 5 a obtenu un score de 63,2 %, contre 58,1 % pour Sonnet 4.6, se rapprochant des 69,2 % d'Opus 4.8. Dans l'évaluation de programmation Terminal-Bench 2.1, Sonnet 5 a atteint 80,4 %, contre 67,0 % pour Sonnet 4.6 et 82,7 % pour Opus 4.8. En matière de raisonnement multidisciplinaire, mesuré par le « dernier examen humain », Sonnet 5 a obtenu 43,2 % sans outil et 57,4 % avec outil, ce dernier résultat étant pratiquement équivalent aux 57,9 % d'Opus 4.8. Dans les tâches d'utilisation d'ordinateur évaluées par OSWorld-Verified, Sonnet 5 a atteint 81,2 %, contre 78,5 % auparavant. Sur le benchmark de travail cognitif GDPval-AA v2, il a obtenu un score de 1 618, dépassant les 1 615 d'Opus 4.8 et les 1 395 de Sonnet 4.6.

Benchmark Sonnet 5

Ces données d'évaluation montrent que Sonnet 5 entre dans une catégorie de performances qui chevauche largement celle du modèle phare d'Anthropic, avec un coût par token inférieur d'environ 60 % au prix standard. L'accent mis sur les capacités agentiques reflète le déplacement du centre de gravité de l'industrie de l'IA vers des systèmes capables d'exécuter de manière autonome des flux de travail en plusieurs étapes. Sualeh Asif, cofondateur de Cursor, un partenaire d'accès anticipé, a déclaré que le modèle est capable de suivre un plan et de livrer des modifications propres en plusieurs étapes, tout en étant rentable. Daniel Shepard, ingénieur senior chez Zapier, a décrit que, lors du test d'un travail automatisé en deux parties, le modèle a pu accomplir une tâche qui « se serait bloquée à mi-chemin » auparavant.

OSWorld-Verified Sonnet 5

Sonnet 5 utilise un tokeniseur mis à jour, similaire aux changements introduits dans Opus 4.7, modifiant la manière dont le modèle traite le texte. Une même entrée peut correspondre à environ 1,0 à 1,35 fois le nombre de tokens selon le type de contenu. Anthropic indique que le prix d'entrée a été calibré pour rendre la transition « à peu près neutre en termes de coûts », mais que les clients d'entreprise exécutant des tâches à forte charge de travail doivent évaluer soigneusement leurs cas d'utilisation spécifiques. Les divulgations de sécurité d'Anthropic montrent que Sonnet 5 a des taux d'hallucination et de flatterie inférieurs à ceux de Sonnet 4.6, qu'il rejette mieux les requêtes malveillantes et qu'il est plus résistant aux attaques par injection de prompts dans un environnement agentique. Lors d'audits comportementaux automatisés, Sonnet 5 a obtenu un score global inférieur à celui de Sonnet 4.6. Cependant, par rapport à Opus 4.8, plus performant, et à Claude Mythos Preview, Sonnet 5 présente « un taux de comportement dysfonctionnel légèrement plus élevé ». Dans l'évaluation du développement d'exploits pour Firefox 147, les deux modèles Sonnet n'ont pas réussi à développer d'exploit efficace, tous deux obtenant un score de 0,0 %, mais Sonnet 5 a un taux de succès partiel de 13,2 %, contre 8,8 % pour Sonnet 4.6, les deux restant bien en dessous des 68,8 % d'Opus 4.8 et des 88,4 % de Mythos 5. Anthropic a activé par défaut les protections de cybersécurité dans Sonnet 5, identiques à celles d'Opus 4.7 et 4.8, mais moins restrictives que celles de Fable 5. Les organisations ayant rejoint le programme de vérification en ligne bénéficient automatiquement des mêmes autorisations.

Sonnet 5 - Firefox 147

La sortie de Sonnet 5 intervient à un moment crucial pour Anthropic. L'entreprise a déposé confidentiellement son prospectus d'introduction en bourse auprès de la Securities and Exchange Commission des États-Unis début juin, une opération que CNBC a décrite comme « l'introduction en bourse la plus attendue de l'histoire de la technologie ». Selon The Guardian, en février, Anthropic a levé 30 milliards de dollars à une valorisation de 380 milliards de dollars, avec un chiffre d'affaires annualisé de 14 milliards de dollars et « une croissance multipliée par plus de dix chaque année au cours des trois dernières années ». Fin mai, Anthropic a finalisé un tour de table de série H de 65 milliards de dollars, codirigé par Altimeter Capital, Sequoia Capital et d'autres, avec une valorisation post-financement de 965 milliards de dollars et un taux de revenus supérieur à 47 milliards de dollars. Harrison Rolfes, analyste chez PitchBook, a déclaré à CNBC que le chiffre clé est la marge brute, que les observateurs extérieurs n'ont pas encore vue. Dans ce contexte, Sonnet 5 vise à améliorer les capacités à un prix compétitif, démontrant que l'entreprise peut proposer des produits attractifs à différents niveaux de prix, favorisant une adoption généralisée. Le gouverneur de Californie, Gavin Newsom, a annoncé que Claude serait proposé à toutes les agences d'État avec une réduction de 50 %, avec une formation gratuite de la main-d'œuvre. Kate Jensen, responsable des Amériques chez Anthropic, a déclaré que cette initiative visait à « mettre Claude au service des personnes qui font fonctionner la Californie ».

Comportement dysfonctionnel de Sonnet 5

Anthropic évolue dans un secteur de plus en plus encombré. OpenAI (qui a levé 122 milliards de dollars à une valorisation de 852 milliards de dollars en mars) cherche également à entrer en bourse ; SpaceX et xAI d'Elon Musk, après leur fusion, ont fixé le prix de leur introduction en bourse à 135 dollars par action, pour une valorisation de 1 770 milliards de dollars ; Google, Meta et les startups d'IA asiatiques se disputent toutes le même marché d'entreprise. Gil Luria, directeur de la recherche technologique chez D.A. Davidson, a déclaré à CNBC que, bien qu'Anthropic « semble être en tête » dans les modèles d'IA de pointe, « la majeure partie de leur utilisation actuelle est destinée à des essais et des expériences, ce qui pourrait ne pas être durable ». Sonnet 5, offrant des performances proches d'Opus à un prix Sonnet, vise directement à transformer l'utilisation expérimentale en revenus de production. Trois éléments détermineront son importance : la fiabilité agentique dans le monde réel, l'économie du tokeniseur et le récit de l'introduction en bourse lui-même. Lorsque le document S-1 sera rendu public, les investisseurs examineront quel niveau génère la majeure partie des revenus et des bénéfices bruts. L'analyste de PitchBook, Rolfes, a souligné à CNBC que la fenêtre d'introduction en bourse de 2026 « sera soit le cycle d'introduction en bourse le plus important depuis l'ère Internet, soit la leçon la plus coûteuse jamais vue sur le marché public entre le récit et les fondamentaux ».

États-Unis

Information et communication Ingénierie de l'intelligence artificielle

Ce texte est rédigé, traduit et republié à partir des informations de l'Internet mondial et de partenaires stratégiques, uniquement pour la communication entre lecteurs. En cas d'infraction au droit d'auteur ou d'autres problèmes, veuillez nous en informer à temps pour la modification ou la suppression. La reproduction de cet article est strictement interdite sans autorisation formelle. Mail : news@wedoany.com

Préc：La compagnie pétrolière serbe NIS obtient une prolongation de l'exemption de sanctions américaines jusqu'au 31 juillet

Suiv：StarkWare publie la feuille de route de la cryptographie post-quantique pour Starknet