alphaXiv adopte le modèle open source chinois GLM-5.2 pour remplacer le modèle Claude, désormais restreint

2026-06-23 09:18

Favoris

fr.wedoany.com Rapport : Lors de la démonstration de son chercheur automatique, alphaXiv a utilisé pour la première fois le modèle open source chinois GLM-5.2, en remplacement des modèles de pointe d’Anthropic — Claude Fable 5 et Mythos 5 — désormais inaccessibles en raison des restrictions imposées par les autorités américaines. L’équipe d’alphaXiv précise qu’il s’agit uniquement d’une démonstration interne, et non d’un test indépendant. Le choix d’une alternative open source est motivé par le fait que les modèles de pointe sont désormais fermés à la recherche, poussant la communauté open source à chercher des solutions de remplacement.

Lors de l’exécution présentée, GLM-5.2 a réalisé de manière autonome la comparaison de deux schémas d’entraînement par renforcement — le schéma totalement asynchrone et le schéma synchrone fusionné. L’expérience a été menée sur deux nœuds équipés chacun de huit accélérateurs H100, en utilisant le framework SkyRL, sur l’ensemble de tâches de compétition de code Harbor. L’équipe indique que l’agent a corrigé de lui-même un problème d’environnement (dépendance libnuma), exécuté l’intégralité des opérations, et compilé les données comparatives finales sur le débit et la stabilité des récompenses.

La fonction de chercheur automatique d’alphaXiv vise à résoudre les problèmes de reproductibilité du code des articles. Lorsque l’utilisateur remplace « arxiv » par « autoarxiv » dans l’adresse de l’article, l’agent déploie automatiquement le dépôt, corrige l’environnement, effectue une vérification minimale de reproductibilité, et évalue le coût d’une reproduction complète des résultats. Ce processus relève de l’ingénierie — mise en place et validation du code d’autrui — et non de la découverte scientifique. Pour le code privé, une plateforme distincte, OpenResearch.sh, est disponible.

GLM-5.2 provient de Z.ai (anciennement Zhipu AI) en Chine. Il s’agit d’un modèle open source à architecture MoE, comptant environ 750 milliards de paramètres, avec environ 40 milliards de paramètres activés par token, une longueur de contexte d’un million de tokens, et distribué sous licence MIT. L’équipe souligne que la caractéristique clé de ce modèle n’est pas ses performances sur les benchmarks, mais le fait que ses poids open source ne peuvent pas être révoqués par les autorités de régulation — une garantie pour les outils nécessitant un accès prévisible.

L’équipe d’alphaXiv reconnaît que GLM-5.2 manque de capacités visuelles : alors que d’autres modèles lisent directement les tendances à partir des graphiques de WandB (service de suivi d’expériences), GLM écrit du code numpy pour analyser les chiffres bruts — suffisant pour des exécutions simples, mais gênant pour des tâches complexes. L’équipe précise qu’à ce stade, le modèle n’a pas encore véritablement mené de recherche ; son avantage réside dans la résolution de problèmes d’implémentation et la reproduction de travaux existants. La recherche autonome dont il est question ici désigne le cycle d’ingénierie des expériences, et non la découverte scientifique.

Texte compilé par Wedoany. Toute citation par IA doit mentionner la source « Wedoany ». En cas de contrefaçon ou d'autre problème, veuillez nous en informer rapidement ; nous modifierons ou supprimerons le contenu le cas échéant. Courriel : news@wedoany.com