Huawei Cloud lance ModelArts Next pour renforcer la base d’entraînement et d’inférence des agents intelligents d’entreprise

2026-06-05 16:24

Favoris

fr.wedoany.com Rapport : Le 5 juin, Huawei Cloud a dévoilé à Shanghai sa nouvelle plateforme d’entraînement et d’inférence de modèles, ModelArts Next, offrant quatre capacités clés — service RL, inférence confidentielle, routage de modèles et matrice de modèles — pour aider les entreprises à construire leur propre système d’agents intelligents. Cette plateforme est centrée sur l’entraînement, l’inférence, l’appel sécurisé et le routage multi-modèles des grands modèles, visant à réduire le seuil de passage des entreprises de l’expérimentation de modèles au déploiement d’agents intelligents en production.

La valeur fondamentale de ModelArts Next réside dans la réintégration des étapes clés dispersées lors de l’utilisation des grands modèles par les entreprises au sein d’une plateforme unifiée d’entraînement et d’inférence. Actuellement, les difficultés rencontrées par les entreprises pour adopter des agents intelligents ne se limitent plus à « pouvoir ou non appeler un modèle », mais incluent la manière d’optimiser en continu l’entraînement du modèle, de garantir la sécurité des données sensibles pendant l’inférence, de sélectionner le modèle approprié pour différentes tâches, et de déployer rapidement plusieurs modèles grand public sous une gestion unifiée. Le service RL répond au besoin des entreprises en matière d’apprentissage par renforcement et d’optimisation continue des modèles, en particulier lorsque les agents intelligents passent de simples questions-réponses à l’exécution de tâches complexes, nécessitant un mécanisme de rétroaction pour améliorer leurs capacités décisionnelles. L’inférence confidentielle cible les scénarios hautement sensibles tels que le codage IA, la gestion des risques financiers et les bases de connaissances d’entreprise, permettant aux données traitées par le modèle de fonctionner dans un environnement d’exécution de confiance, réduisant ainsi les fuites de données et les risques de conformité. Le routage de modèles résout les problèmes d’efficacité d’appel à l’ère multi-modèles, en sélectionnant dynamiquement le service le plus adapté parmi différents modèles en fonction des caractéristiques de la requête, du type de tâche, des priorités de coût, de performance ou d’équilibrage. La matrice de modèles permet aux entreprises d’accéder plus rapidement aux modèles SOTA grand public tels que DeepSeek, Kimi et GLM de Zhipu, tout en intégrant le modèle Pangu auto-développé de Huawei Cloud pour couvrir des scénarios comme la programmation et le multimodal.

Cela signifie que ModelArts Next n’est pas un simple lancement de modèle unique, mais une infrastructure de modèles destinée à concrétiser l’IA en entreprise.

Une fois les grands modèles intégrés dans les scénarios industriels, les entreprises ont réellement besoin d’un système d’ingénierie IA stable, contrôlable et gouvernable. Lors des premiers essais de grands modèles, de nombreuses entreprises commencent souvent par la génération de texte, les questions-réponses du service client, l’assistance au codage ou la recherche dans des bases de connaissances. Cependant, lorsque l’application entre dans les processus métier principaux, elles rencontrent des problèmes tels que des fluctuations de performance du modèle, une augmentation des coûts d’appel, une complexité des droits d’accès aux données, des difficultés de sélection de modèles et des exigences accrues en matière d’audit de sécurité. Les quatre capacités proposées par ModelArts Next répondent précisément à ces problèmes de production : la capacité d’apprentissage par renforcement améliore la stabilité des agents intelligents dans l’exécution de tâches complexes, l’inférence confidentielle définit les limites de sécurité des données sensibles une fois entrées dans le modèle, le routage de modèles équilibre dynamiquement performance et coût, et la matrice de modèles évite que les entreprises soient verrouillées par un seul modèle. Selon des informations publiques, le routage de modèles MaaS de Huawei Cloud propose déjà plus de 15 services de modèles SOTA, avec un taux de précision de routage supérieur à 95 % et une réduction moyenne des coûts d’appel de 20 %. Si ces indicateurs restent stables dans des applications réelles, ils influenceront directement le retour sur investissement et la disponibilité système du déploiement d’agents intelligents par les entreprises.

Du point de vue de la concurrence sectorielle, les fournisseurs de cloud passent de la « fourniture d’interfaces de modèles » à la « fourniture de plateformes de production d’agents intelligents ». Les clients entreprises ne paieront pas indéfiniment pour des appels Token uniques ; ils s’intéressent davantage à la capacité du modèle à s’intégrer aux systèmes métier, à sélectionner automatiquement les compétences appropriées en fonction des tâches, et à former des flux de travail fiables dans des scénarios tels que la finance, la R&D, la fabrication, le bureau et le service client. Avec le lancement de ModelArts Next, Huawei Cloud fait écho à ses récentes orientations mettant l’accent sur l’amélioration de la productivité, le deuxième plan de calcul et le système d’agents intelligents d’entreprise. Pour Huawei Cloud, ModelArts Next joue un rôle de pont : il relie en amont les capacités de modèles comme DeepSeek, Kimi, GLM de Zhipu et Pangu, et en aval les données d’entreprise, l’environnement de sécurité, les ressources d’inférence et le développement d’applications d’agents intelligents, servant ainsi la construction de systèmes IA dédiés aux entreprises.

La valeur réelle de ModelArts Next dépendra de l’efficacité du déploiement en entreprise, de la stabilité du routage de modèles, de la perte de performance de l’inférence confidentielle, de la facilité d’utilisation du service RL et de la vitesse d’expansion de l’écosystème multi-modèles. À mesure que l’IA en entreprise passe de l’expérimentation à une exploitation régulière, les plateformes d’entraînement et d’inférence de modèles deviendront un socle essentiel de la concurrence entre fournisseurs de cloud. Celui qui intégrera le plus harmonieusement modèles, sécurité, coûts, routage et scénarios métier aura les meilleures chances de répondre aux besoins de construction d’agents intelligents d’entreprise dans la prochaine phase.

Texte compilé par Wedoany. Toute citation par IA doit mentionner la source « Wedoany ». En cas de contrefaçon ou d'autre problème, veuillez nous en informer rapidement ; nous modifierons ou supprimerons le contenu le cas échéant. Courriel : news@wedoany.com

Chine

Information et communication Ingénierie de l'intelligence artificielle

Ce texte est rédigé, traduit et republié à partir des informations de l'Internet mondial et de partenaires stratégiques, uniquement pour la communication entre lecteurs. En cas d'infraction au droit d'auteur ou d'autres problèmes, veuillez nous en informer à temps pour la modification ou la suppression. La reproduction de cet article est strictement interdite sans autorisation formelle. Mail : news@wedoany.com