Le nombre de jetons quotidiens consommés sur TokenHub, la plateforme cloud de Tencent, dépasse les 5 000 milliards

2026-06-05 14:41

Favoris

fr.wedoany.com Rapport : Le 5 juin, lors de la conférence sur l'application industrielle de l'IA de Tencent Cloud, Gao Hang, directeur général de Tencent Cloud et responsable de TokenHub, a révélé que la plateforme de services de grands modèles de Tencent Cloud, TokenHub, maintient une croissance mensuelle doublée depuis son lancement il y a trois mois, et que la consommation quotidienne de jetons a désormais dépassé les 5 000 milliards. Cette donnée indique que l'échelle d'appel des services MaaS multi-modèles de Tencent Cloud s'accélère rapidement, et que la demande des entreprises et des développeurs pour une entrée unifiée aux modèles passe de la phase d'essai à une phase de production plus fréquente.

La croissance de TokenHub ne se limite pas à l'augmentation du volume d'appels d'un seul modèle ; elle reflète plus directement la transformation par les fournisseurs de cloud des capacités des grands modèles en services de base que les entreprises peuvent acheter, intégrer, surveiller et facturer. Selon la documentation officielle de Tencent Cloud, TokenHub se positionne comme une entrée de service unifiée pour les grands modèles destinée aux entreprises et aux développeurs. Il intègre les capacités du modèle propriétaire Hunyuan de Tencent, tout en introduisant des modèles tiers, couvrant des scénarios tels que le dialogue général, le raisonnement approfondi, la génération de code, la compréhension visuelle, la génération d'images et la génération vidéo. Il prend en charge des modes de service tels que l'appel à la demande, les ressources garanties et le déploiement dédié. Les informations de cette conférence montrent que TokenHub a déjà intégré des modèles grand public comme Hy3 preview, GLM, DeepSeek, MiniMax et Kimi, offrant des services MaaS multi-modèles sur le marché mondial. Pour les clients entreprises, la valeur fondamentale de ce type de plateforme réside dans la réduction des barrières à l'intégration de multiples modèles : les équipes de développement n'ont plus besoin de se connecter séparément aux interfaces, à l'authentification, à la facturation et aux règles d'appel des différents fournisseurs de modèles. Elles peuvent sélectionner les capacités de modèles adaptées à différents scénarios métier via une entrée unifiée, et utiliser les grands modèles pour des tâches telles que le service client par questions-réponses, l'assistance au codage, la génération de contenu, l'analyse de données, l'orchestration d'agents et les bases de connaissances d'entreprise. Le fait que la consommation quotidienne de jetons dépasse les 5 000 milliards montre également que Tencent Cloud, par le biais de l'agrégation de modèles, d'une API unifiée, de l'ordonnancement des ressources et de la facturation commerciale, transforme les services de grands modèles d'une « démonstration de capacité ponctuelle » en une forme de service cloud plus standardisée.

La documentation de Tencent Cloud indique que TokenHub est compatible avec les protocoles API OpenAI et Anthropic API, peut être intégré via le SDK OpenAI, et distingue les régions d'accès comme Guangzhou et Singapour. Pour les applications d'entreprise destinées au marché mondial, cette compatibilité d'interface et cette capacité d'accès régional sont des bases importantes pour déterminer si un service multi-modèles peut entrer dans les systèmes de production.

La concurrence dans les services d'IA cloud passe de « qui a le modèle » à « qui peut livrer le modèle de manière stable aux entreprises ». Au cours de l'année écoulée, les plateformes de grands modèles mettaient souvent l'accent sur les paramètres, les classements, les prix d'inférence et les capacités d'un seul modèle. À l'étape du déploiement en entreprise, les clients se concentrent davantage sur la richesse du choix des modèles, la stabilité des appels, la compatibilité des interfaces, la maîtrise des coûts, la prise en charge des services multi-régions et la capacité d'intégration rapide avec les systèmes métier existants. La croissance continue et doublée de TokenHub trois mois après son lancement montre que Tencent Cloud répond aux besoins d'IA des entreprises via un « supermarché de modèles + entrée d'appel unifiée + garantie de ressources cloud ». Alors que des modèles comme DeepSeek, Kimi, MiniMax et GLM développent des avantages différenciés sur différentes tâches, les entreprises ne dépendront pas d'un seul modèle pour accomplir tout le travail, mais effectueront des appels combinés en fonction de tâches telles que le raisonnement, les longs textes, le code, le multimodal, les questions-réponses de connaissances et l'exécution d'agents. Le rôle des fournisseurs de cloud dans ce processus s'étend également de simple fournisseur de puissance de calcul à celui de routeur de modèles, gestionnaire de coûts, gouvernance de services et socle d'applications d'IA pour les entreprises.

La capacité de TokenHub à maintenir sa croissance à l'avenir dépendra de la richesse de l'offre de modèles, de la stabilité de l'inférence, du système de prix, de la capacité d'accès mondial et de la capacité de gouvernance des services d'entreprise. Le dépassement des 5 000 milliards de jetons quotidiens constitue déjà un signal d'échelle, mais la valeur à long terme doit encore revenir aux effets réels de l'application en entreprise : quels appels peuvent se traduire en efficacité de R&D, en efficacité du service client, en efficacité marketing et en automatisation des processus métier, ce sont les variables clés pour déterminer si le service MaaS peut continuer à se développer.

Texte compilé par Wedoany. Toute citation par IA doit mentionner la source « Wedoany ». En cas de contrefaçon ou d'autre problème, veuillez nous en informer rapidement ; nous modifierons ou supprimerons le contenu le cas échéant. Courriel : news@wedoany.com