Facewall Intelligence publie en open source le premier grand modèle efficace côté terminal entraîné sur une plateforme de calcul nationale Introduction technologique_Application technologique

Facewall Intelligence publie en open source le premier grand modèle efficace côté terminal entraîné sur une plateforme de calcul nationale

2026-05-26 17:03

Favoris

Récemment, Facewall Intelligence, en collaboration avec l'Université Tsinghua et la communauté open source OpenBMB, a officiellement publié et ouvert en open source son dernier résultat dans le domaine de l'entraînement de grands modèles à faible bit — BitCPM-CANN. Il s'agit du premier grand modèle ternaire (1,58-bit) entièrement entraîné de bout en bout et publié en open source sur une plateforme de calcul nationale (Huawei Ascend). Illustration du modèle BitCPM-CANN

Depuis longtemps, le goulot d'étranglement physique de la mémoire constitue un défi pour l'application à grande échelle des grands modèles, la mémoire devenant l'une des ressources les plus tendues de la chaîne d'approvisionnement mondiale en IA. Dans ce contexte, BitCPM-CANN adopte une approche d'entraînement sensible à la quantification, obligeant chaque bit à déployer une densité d'information et une efficacité de stockage des connaissances maximales. Parallèlement, l'optimisation de la mémoire vidéo par un facteur 6 offerte par BitCPM-CANN permet aux entreprises d'améliorer les capacités du modèle ou la densité de service sans augmenter la mémoire physique.

Il convient de noter que, depuis les opérateurs de quantification les plus bas niveau et les algorithmes d'entraînement sensibles à la quantification, jusqu'à la stratégie de parallélisation complète et le cadre d'entraînement, toute la chaîne d'entraînement de BitCPM-CANN a été réalisée de manière native sur Huawei Ascend. Elle comprend quatre tailles de modèles : 0,5B, 1B, 3B et 8B. Comparé élément par élément à la famille MiniCPM-4 en pleine précision de même taille, ses performances sont excellentes. Il s'agit du premier résultat public sur la plateforme Ascend à avoir accompli un entraînement 1,58-bit de bout en bout et une évaluation comparative en pleine précision, avec une échelle de modèle portée d'un seul coup jusqu'au niveau 8B.

Les professionnels du secteur estiment que la publication et l'open source de BitCPM-CANN réalisent une boucle complète et fermée intégrant un NPU national, un modèle national et un cadre d'entraînement national, offrant ainsi à l'industrie de l'IA côté terminal une solution de modèle à faible bit directement utilisable.

Chine

Information et communication

Ce texte est rédigé, traduit et republié à partir des informations de l'Internet mondial et de partenaires stratégiques, uniquement pour la communication entre lecteurs. En cas d'infraction au droit d'auteur ou d'autres problèmes, veuillez nous en informer à temps pour la modification ou la suppression. La reproduction de cet article est strictement interdite sans autorisation formelle. Mail : news@wedoany.com

Préc：Conduite autonome entièrement électrique + collaboration terminal-cloud : l'équipement minier complet chinois SANY exporté en masse, redéfinissant le paysage concurrentiel mondial des équipements miniers

Suiv：Premier robot intelligent d'arrosage de Chine : faire passer la construction urbaine de la réception empirique à l'évaluation intelligente de la qualité