Sur une chaîne de production métallurgique des métaux non ferreux longue de plusieurs kilomètres, l’IA n’est plus seulement un « assistant textuel » capable de discuter : elle comprend le langage industriel, possède une pensée métallurgique et peut réguler avec précision l’ensemble du processus de production. En septembre 2025, lors de la Conférence nationale des logiciels industriels 2025 organisée par la Société chinoise d’automatisation, le premier grand modèle chinois dédié à l’industrie de la métallurgie des métaux non ferreux, baptisé « ZhiYe DaMoXing », a été officiellement dévoilé. Cela marque l’avènement d’un nouveau paradigme d’application industrielle de l’intelligence incarnée pour le contrôle intelligent, où les grands modèles passent de la « capacité à dialoguer » à la « capacité à agir ».

Le dilemme de la « dépendance à l’expérience » dans la métallurgie centenaire
Le processus de métallurgie des métaux non ferreux est long et complexe, depuis l’extraction du minerai, le criblage et la purification, jusqu’à la fusion, le traitement et l’inspection des produits finis, chaque étape est semée de défis. Prenons l’exemple de la fusion du cuivre : une chaîne de production s’étend sur plusieurs kilomètres, impliquant de multiples opérations telles que le grillage, la fusion, la conversion et l’affinage, où des paramètres comme la température, la pression et les proportions de matières premières changent constamment.
Dans le modèle traditionnel, la régulation de ces paramètres dépend fortement du jugement empirique des ingénieurs et des opérations manuelles. Le « toucher » et le « coup d’œil » des ouvriers expérimentés deviennent des garanties clés de la qualité de production, mais présentent aussi des limites évidentes : difficulté à reproduire l’expérience, lenteur de réponse, et complexité de l’optimisation multivariable coordonnée. En particulier sur des équipements clés comme les fours de grillage, un léger écart de température peut entraîner des problèmes : une température insuffisante conduit à un grillage incomplet et à une baisse du taux de récupération des métaux ; une température excessive provoque le frittage et la fusion des matières, augmentant inutilement la consommation d’énergie et endommageant le four.
Comment faire en sorte que l’IA comprenne réellement les lois physico-chimiques de la production industrielle, sans se limiter au simple « dialogue », devient la question centrale de la transformation intelligente du secteur.
Architecture en boucle fermée à quatre couches : permettre à l’IA de « maîtriser les procédés et de contrôler »
L’équipe du professeur Yang Chunhua de l’Université centrale du Sud a connu trois générations d’itérations dans le développement du grand modèle ZhiYe : de l’optimisation ponctuelle initiale au contrôle au niveau des opérations, jusqu’à la troisième génération qui a réalisé l’optimisation de l’ensemble du processus.
Architecture en boucle fermée à quatre couches : de l’adaptation verticale au retour incarné
Dans un article publié dans le « Journal of Automation » intitulé « Exploration d’un nouveau paradigme de construction de grands modèles d’intelligence incarnée pour le contrôle intelligent dans les domaines industriels verticaux », l’équipe de recherche a systématiquement exposé l’architecture technique du modèle. Celui-ci construit une architecture en boucle fermée à quatre couches intégrant l’adaptation verticale, le contrôle incarné, la vérification de confiance et le retour incarné.
L’innovation centrale de cette architecture réside dans le fait que le grand modèle non seulement « comprend » le langage industriel, mais peut aussi « maîtriser » la pensée métallurgique. Contrairement aux grands modèles généraux traditionnels, le modèle ZhiYe, grâce à un micro-ajustement supervisé dans le domaine vertical, acquiert une maîtrise préliminaire de la terminologie et du système de connaissances propres à la métallurgie des métaux non ferreux. Plus important encore, dans la phase de post-entraînement, une stratégie de micro-ajustement par apprentissage par renforcement est introduite, combinée à un mécanisme de raisonnement par chaîne de pensée, permettant au modèle de faire face à des scénarios dynamiques complexes et à des problèmes imprévus.
Intégration des lois physico-chimiques : résoudre le problème des « hallucinations » des grands modèles
Les grands modèles généraux sont confrontés depuis longtemps à un défaut fatal dans les applications industrielles : le phénomène d’« hallucination », où le modèle peut générer des solutions logiques sur le plan linguistique mais contraires aux lois physico-chimiques, ce qui est inacceptable dans la production industrielle.
L’équipe de recherche a proposé de manière innovante un modèle de récompense hybride intégrant les lois physico-chimiques : en intégrant un graphe de connaissances dans le grand modèle, et en utilisant une stratégie de renforcement par contraste lors de l’entraînement par apprentissage par renforcement basé sur la chaîne de pensée, des paires de données positives et négatives en chaîne sont échantillonnées et générées pour entraîner le modèle de récompense par apprentissage par renforcement. Grâce à des itérations d’apprentissage répétées, on garantit que les solutions produites par le grand modèle satisfont progressivement aux contraintes strictes des lois physico-chimiques.
Cela signifie que chaque instruction de régulation donnée par l’IA a été « vérifiée » par les lois physico-chimiques, acquérant ainsi une valeur pratique industrielle.
Déploiement matériel : 8 nœuds haute performance pour un contrôle en temps réel
Le modèle est déployé sur 8 nœuds de calcul haute performance, chacun équipé d’un processeur Intel Xeon Platinum 8470Q, de 512 Go de mémoire et d’une carte graphique NVIDIA A100. Le code de contrôle industriel généré est testé sur une plateforme de vérification interactive virtuelle-réelle pour la métallurgie des métaux non ferreux, réalisant un contrôle en boucle fermée allant de l’identification du problème à la génération de la solution et à l’exécution du code.
Données de test : temps de montée en température réduit de près de 200 secondes, dépassement moyen réduit de 40 %
L’équipe de recherche a pris le contrôle de la température d’un four de grillage comme cas d’étude, et a comparé systématiquement le grand modèle d’intelligence incarnée pour le contrôle intelligent avec l’algorithme de contrôle PID classique et des grands modèles généraux tels que Llama3.1, DeepSeek-R1 et Qwen3.
Les résultats expérimentaux sont remarquables :
Réponse dynamique : le grand modèle d’intelligence incarnée pour le contrôle intelligent atteint un chauffage rapide d’environ 250 secondes, soit près de 200 secondes de moins que le modèle Qwen3, le plus lent en chauffage ;
Stabilité du contrôle : le dépassement maximal n’est que de 1,36 %, soit une réduction moyenne d’environ 40 % par rapport au contrôle PID classique et aux autres grands modèles ;
Précision en régime permanent : l’erreur en régime permanent est stable à ±8,0 °C, avec un temps de réglage d’environ 335 secondes, tandis que le contrôle PID classique, bien qu’ayant une erreur en régime permanent comparable, nécessite un temps de réglage allant jusqu’à 634 secondes.
En termes de complétude, de cohérence logique et de richesse des détails du raisonnement par chaîne de pensée, le grand modèle d’intelligence incarnée pour le contrôle intelligent surpasse également significativement les grands modèles généraux tels que DeepSeek-R1, ChatGPT-01 et Gemini-2.5-Pro.
De la « percée ponctuelle » au « contrôle intelligent de toute la chaîne »
Optimisation de l’ensemble du processus : le « cerveau intelligent » d’une chaîne de production de plusieurs kilomètres
Le professeur Yang Chunhua souligne que la troisième génération du grand modèle ZhiYe a réalisé l’optimisation de l’ensemble du processus : « Il peut lire et analyser les données de tout le processus de production, sur une chaîne de production longue de plusieurs kilomètres, identifier où se situent les problèmes, puis les réguler un par un. » Cela signifie que l’IA ne se limite plus à l’optimisation d’une seule opération, mais possède une vision globale et une capacité de décision systémique.
Accélération du déploiement des usines intelligentes
Les applications industrielles se multiplient rapidement. En juin 2026, le centre de contrôle intelligent de l’usine intelligente de Wukuang Copper, construit par MCC Jingcheng, a été officiellement mis en service. Ce centre intègre des grands modèles industriels et des technologies d’IA, créant un centre de contrôle intelligent combinant opérations à distance, analyse et planification intelligentes, et aide à la décision par IA, avec 14 scénarios d’application d’IA intelligente déployés. Auparavant, le groupe Chinalco avait déjà publié le grand modèle d’IA « Kun’an » pour l’industrie des métaux non ferreux, couvrant l’ensemble des maillons, de l’exploration géologique, à l’extraction minière, en passant par la fusion et le traitement, et le recyclage. En avril 2026, China Ruilin et Huawei ont conjointement créé un centre d’innovation conjoint pour l’IA dans la métallurgie du cuivre, se concentrant sur le déploiement d’applications d’IA dans les opérations clés de la métallurgie du cuivre.
Des métaux non ferreux à l’acier : un paradigme industriel reproductible
Le paradigme technique du grand modèle ZhiYe s’étend à l’industrie sidérurgique. En juin 2026, le grand modèle « Baogang ZhiYe » pour la sidérurgie intelligente a été mis en service avec succès sur le convertisseur n°1 de Baotou Steel, intégrant profondément des données hétérogènes multi-sources telles que la reconnaissance visuelle de la flamme à l’embouchure du convertisseur, l’analyse des gaz de fumée et la détection audio, réalisant trois fonctions clés : identification précise en temps réel de l’état de soufflage du convertisseur, prédiction à haute précision de la température et de la teneur en carbone au point final, et régulation intelligente coordonnée de l’oxygène et de la hauteur de la lance. La sidérurgie traditionnelle de Baotou dit définitivement adieu à l’ancien modèle « dominé par l’expérience ».
Soutien d’une plateforme nationale
Le 15 juin 2026, la première plateforme nationale de test de niveau intermédiaire en IA dans le domaine de la métallurgie a été inaugurée à Nanjing, dans la province du Jiangsu, marquant une nouvelle étape dans la validation industrielle des technologies d’IA dans le secteur métallurgique chinois.
Redéfinir les limites de la « fabrication intelligente »
La valeur profonde de cette réalisation réside dans la reconstruction du paradigme d’application des grands modèles dans le domaine industriel. Auparavant, l’application des grands modèles d’IA dans l’industrie se limitait souvent à des aspects comme les questions-réponses de connaissances et la génération de documents, c’est-à-dire la « capacité à dialoguer » ; le grand modèle ZhiYe a réalisé pour la première fois le passage de la « capacité à dialoguer » à la « capacité à agir » : l’IA peut non seulement répondre à la question « Quelle température faut-il régler ? », mais aussi générer directement du code de contrôle industriel, réguler avec précision les équipements et optimiser la production en boucle fermée.
Comme le souligne l’équipe de recherche dans son article, ce paradigme « jette un pont entre la technologie et son application concrète, permettant aux grands modèles de passer des laboratoires aux ateliers industriels ». Alors que l’IA pénètre véritablement les ateliers à haute température, l’industrie centenaire de la métallurgie des métaux non ferreux connaît une transformation profonde, passant d’une « logique d’expérience » à une « logique de données et d’algorithmes ».
