L'IA chinoise Zhipu AI publie GLM 5.2 en poids ouverts, défiant le modèle payant

2026-06-24 11:36

Favoris

fr.wedoany.com Rapport : Z.ai (anciennement Zhipu AI) a publié un modèle d'IA à poids ouverts nommé GLM 5.2, téléchargeable, personnalisable et exécutable entièrement sur des appareils locaux, défiant ainsi l'idée répandue selon laquelle les performances élevées en IA ne sont accessibles qu'en payant des abonnements premium aux géants de la technologie.

Contrairement aux systèmes fermés comme ChatGPT ou Claude, GLM 5.2 offre aux développeurs un accès direct au modèle lui-même. Dans un secteur de plus en plus dominé par des serveurs d'entreprise fermés, cette caractéristique confère aux utilisateurs un plus grand contrôle. Z.ai souligne qu'avec l'émergence de modèles comme la série Llama de Meta, Mistral et GLM 5.2, l'écart entre l'IA haut de gamme et les modèles ouverts se réduit rapidement. De nombreuses entreprises n'ont pas besoin de modèles capables de résoudre des problèmes logiques théoriques de niveau mondial ; elles ont plutôt besoin d'un système capable de résumer avec précision de grandes bibliothèques de documents internes, ou d'écrire et de déboguer du code de manière autonome. Si un modèle ouvert peut accomplir 90 à 95 % de ces tâches à un coût bien inférieur, il ne peut être ignoré.

L'attention portée à GLM 5.2 a rapidement augmenté lorsque des développeurs ont réussi à le démontrer en fonctionnement local sur des appareils Apple haut de gamme comme le Mac mini. Cette démonstration prouve qu'une IA puissante peut désormais être « possédée », et non plus seulement « louée par abonnement ». Dans les modèles basés sur l'abonnement, un tiers contrôle les prix, les politiques de confidentialité et la feuille de route des fonctionnalités, tandis que les modèles à poids ouverts inversent cette tendance. Pour les secteurs traitant des données financières sensibles, des dossiers médicaux ou des recherches exclusives d'entreprise, la possibilité de conserver toutes les données sur du matériel interne constitue un avantage de sécurité significatif. À l'avenir, la pile technologique des entreprises ressemblera probablement à une pile d'IA « hybride » : des modèles fermés de premier plan traitent les problèmes de raisonnement les plus difficiles ; des modèles à poids ouverts pilotent des flux de travail de routine à volume élevé ; et des modèles hébergés localement gèrent en toute sécurité les données internes les plus confidentielles.

GLM 5.2 est un vaste modèle de mélange d'experts (MoE) comptant entre 7440 et 7530 milliards de paramètres. Sous sa forme non compressée, ses poids consomment 1,51 To de stockage et de mémoire. Les PC haut de gamme standard disposent d'un maximum de 24 Go de VRAM, ce qui crée un « mur de VRAM » ; le Mac Studio, avec un maximum de 256 Go de mémoire unifiée, peut exécuter une version hautement compressée. Pour exécuter GLM 5.2 localement, les développeurs doivent utiliser des techniques de quantification pour une compression agressive. Même après une compression sévère, le chargement du modèle nécessite environ 240 Go de mémoire. De plus, GLM 5.2 possède une fenêtre de contexte de 1 million de tokens, identique à celle de Claude, ce qui signifie qu'il peut ingérer en une seule fois une base de code entière ou les livres d'une petite bibliothèque. Cependant, le suivi d'une telle quantité de données nécessite une allocation mémoire spécialisée, et pousser le modèle à ses limites peut entraîner une surchauffe, même sur les ordinateurs de bureau grand public les plus puissants.

Pour les non-programmeurs, cette actualité reste pertinente. L'IA transforme fondamentalement les logiciels utilisés quotidiennement. GLM 5.2 ne remplacera pas les applications sur votre téléphone demain, mais il met en évidence le fait que les modèles ouverts deviennent moins chers et extrêmement compétitifs. À mesure que les entreprises de logiciels auront plus d'options, sans avoir à payer des frais élevés à un seul fournisseur pour ajouter des fonctionnalités d'IA à leurs applications, ce changement pourrait signifier que la prochaine génération d'outils numériques sera moins chère, hautement spécialisée et plus respectueuse de la vie privée. Les modèles d'IA ouverts comme GLM 5.2 ne sont pas seulement des alternatives, mais un défi important au modèle d'abonnement coûteux, offrant aux entreprises et aux développeurs l'opportunité de construire des solutions plus efficaces, plus sûres et plus abordables.

Texte compilé par Wedoany. Toute citation par IA doit mentionner la source « Wedoany ». En cas de contrefaçon ou d'autre problème, veuillez nous en informer rapidement ; nous modifierons ou supprimerons le contenu le cas échéant. Courriel : news@wedoany.com