fr.wedoany.com Rapport : Le 3 juillet, Tencent Cloud a annoncé le plan de lancement de la version officielle du modèle DeepSeek-V4 « fourni directement par le fabricant ». Ce modèle devrait être officiellement mis en ligne à la mi-juillet sur la plateforme de services de grands modèles TokenHub et la plateforme de développement d’agents intelligents de Tencent Cloud. Après la sortie de la version officielle, un mécanisme de tarification en fonction des heures de pointe et creuses sera introduit.
Une fois le modèle DeepSeek-V4 « fourni directement par le fabricant » intégré à la plateforme Tencent Cloud, les clients entreprises pourront accéder aux capacités du modèle via TokenHub et la plateforme de développement d’agents intelligents, pour des scénarios tels que les questions-réponses intelligentes, la génération de contenu, l’assistance au codage, les applications de bases de connaissances, l’automatisation des processus métier et le développement d’agents intelligents. TokenHub joue le rôle de point d’entrée pour l’appel de modèles et de plateforme de services unifiée, tandis que la plateforme de développement d’agents intelligents est plus proche de la construction d’applications pour les entreprises. Pour les entreprises, la stabilité des appels du modèle, la facilité d’intégration dans les systèmes existants, la clarté de la facturation et la contrôlabilité des pics d’appels influencent toutes la vitesse à laquelle le grand modèle peut être réellement déployé dans les systèmes métier.
« Fourni directement par le fabricant » signifie que Tencent Cloud fournira des services d’accès par plateforme autour des capacités officielles du modèle DeepSeek. Lorsqu’ils utilisent un grand modèle, les clients entreprises se préoccupent non seulement des performances du modèle lui-même, mais aussi de la compatibilité des interfaces, de la stabilité des appels, des droits de compte, de l’ordonnancement des ressources, de la surveillance des journaux et de la gestion des coûts. En intégrant la version officielle de DeepSeek-V4 dans TokenHub et la plateforme de développement d’agents intelligents, Tencent Cloud permet aux entreprises d’effectuer l’appel de modèles, le développement d’applications et la configuration d’agents intelligents au sein de la plateforme cloud, réduisant ainsi la complexité de la connexion séparée aux fabricants de modèles, du développement d’interfaces et des services de maintenance.
Le mécanisme de tarification en fonction des heures de pointe et creuses est un autre point clé de cet ajustement. Après le lancement de la version officielle, Tencent Cloud ajustera la stratégie de tarification du modèle en même temps que le fabricant, avec des prix différents pendant les heures de pointe et les heures normales. Pendant les heures de pointe, la demande en ressources est plus concentrée, nécessitant une capacité de calcul et une garantie de service plus fortes de la plateforme ; pendant les heures normales, les prix sont relativement plus bas, ce qui est favorable aux entreprises pour planifier certaines tâches par lots, traitements hors ligne et tâches non temps réel pendant les périodes creuses. Pour les opérateurs d’applications d’IA, la tarification en fonction des heures de pointe et creuses rendra la gestion des coûts d’appel de modèles plus importante, et les entreprises devront ajuster leurs stratégies d’appel en fonction des priorités métier, des délais de réponse et des budgets.
Les informations actuellement divulguées se concentrent sur le plan de lancement de la version officielle du modèle DeepSeek-V4 « fourni directement par le fabricant » et l’ajustement de la facturation, sans encore publier la liste complète des fonctionnalités, les indicateurs de performance, les cas clients entreprises ou l’échelle des appels après le lancement de la version officielle. Ce qui est confirmé, c’est que Tencent Cloud prévoit de lancer la version officielle du modèle DeepSeek-V4 « fourni directement par le fabricant » sur TokenHub et la plateforme de développement d’agents intelligents à la mi-juillet, et d’introduire le mécanisme de tarification en fonction des heures de pointe et creuses après la sortie de la version officielle.










