Le GLM-5.2 de Zhipu AI, deuxième mondial et premier open source dans le classement de codage IA

2026-06-17 14:52

Favoris

fr.wedoany.com Rapport : Le GLM-5.2 développé par Zhipu AI (Chine) a obtenu d’excellents résultats dans le domaine du codage IA. Ce modèle se classe deuxième mondial dans le classement Arena et premier parmi les modèles open source. Sur le Design Arena, spécialisé dans l’évaluation du goût des modèles, le GLM-5.2 a décroché la première place mondiale.

Les responsables d’Arena ont qualifié les performances du GLM-5.2 de « jalon incroyable ».

Sur le Design Arena, le GLM-5.2 a obtenu la première place mondiale.

Dans huit tests de référence faisant autorité, le GLM-5.2 s’est distingué de manière notable.

D’après les résultats, un grand modèle open source chinois a, pour la première fois, intégré le top 3 mondial dans le domaine du codage, rejoignant ainsi Claude et OpenAI dans le premier groupe. Le Gemini de Google, souvent mentionné auparavant, a été supplanté par le GLM-5.2 en termes de capacités dans ce classement.

Des blogueurs étrangers ont mené plusieurs tests concrets, comparant le GLM-5.2 avec le GPT-5.5 High, l’Opus 4.8 High et le Kimi K2.7 Code.

Un blogueur estime que ce test reflète bien la puissance réelle de l’IA, les performances du GLM-5.2 étant proches de celles du Claude Opus 4.8. Un autre blogueur a déclaré après les tests : « This is crazy ».

Le GLM-5.2 prend en charge un contexte de 1M réellement utilisable, maintenant une avance dans les tâches de longue durée. Cela signifie qu’il peut traiter des contextes de projets volumineux et progresser de manière autonome sur plusieurs heures.

Les tests ont utilisé le projet Appsmith sur GitHub, une plateforme open source low-code permettant de construire des tableaux de bord, des panneaux d’administration et d’autres applications internes.

Lors des tests pratiques, le GLM-5.2 a bien performé dans des scénarios tels que la compréhension complète d’une base de code, la recherche de bugs entre fichiers, l’ajout de nouvelles fonctionnalités et le multitâche. Dans le projet Appsmith, il a décomposé le projet en une structure monorepo, localisé avec précision les parties front-end, back-end et les répertoires divisés, et identifié plusieurs points de couplage critiques. Dans le projet OpenWebUI, il a réussi à localiser un problème de limite dans le retour en flux DirectConnection et a proposé une solution. Lors du test de nouvelle fonctionnalité, il a divisé la fonction « Export Markdown » en cinq couches (outil back-end, routage, API front-end, entrée UI et tests) et a exécuté avec succès 38 tests back-end. Dans le test multitâche, il a généré en une seule fois un ensemble complet de rapports d’analyse, de tableaux, de graphiques et de scripts.

Les experts soulignent que la compétition dans le codage IA entre dans une phase de capacité de travail à long terme. Actuellement, les développeurs commencent à intégrer les modèles dans des flux d’ingénierie réels : le modèle doit lire l’intégralité du projet, comprendre l’architecture, suivre les chaînes d’appels, maintenir les contraintes des exigences, modifier plusieurs fichiers, compléter les tests et générer la documentation. Dans ce contexte, la voie représentée par le GLM-5.2 — open source, long contexte, orienté vers des tâches d’ingénierie réelles pour les agents de codage — est en train de devenir une troisième option, aux côtés de Claude Code et OpenAI CodeX.

Texte compilé par Wedoany. Toute citation par IA doit mentionner la source « Wedoany ». En cas de contrefaçon ou d'autre problème, veuillez nous en informer rapidement ; nous modifierons ou supprimerons le contenu le cas échéant. Courriel : news@wedoany.com

Chine