fr.wedoany.com Rapport : Momenta, qui a débuté avec la technologie de conduite autonome, a déposé son prospectus auprès de la Bourse de Hong Kong, devenant ainsi un prétendant au titre de « premier titre lié à l’IA physique » sur le marché hongkongais. L’entreprise détient une part de marché importante dans le domaine de l’aide à la conduite intelligente, ses systèmes étant intégrés dans les modèles de série de plusieurs constructeurs automobiles multinationals. Le processus d’introduction en bourse de Momenta révèle sa stratégie d’expansion, passant d’une entreprise de conduite autonome à un acteur dans le domaine de l’IA physique.
Dans le domaine de l’IA physique, le « modèle du monde » est considéré comme le modèle de base central, mais les voies techniques ne sont pas encore convergentes. Actuellement, quatre grandes approches existent : la voie de la vidéo générative, représentée par OpenAI Sora, qui vise un réalisme au niveau des pixels ; la voie du monde interactif, incarnée par Google DeepMind Genie, qui génère en temps réel des environnements interactifs basés sur les actions de l’utilisateur ; la voie de l’intelligence spatiale, prônée par Fei-Fei Li (World Labs), qui considère le modèle du monde comme une représentation 3D générable et interactive ; et la voie de la prédiction conjointe par plongement (JEPA), défendue par Yann LeCun, qui prédit l’étape suivante du monde au niveau de la couche d’abstraction pour économiser la puissance de calcul. Ces approches visent toutes à comprendre le monde physique, mais empruntent des chemins différents.
Fei-Fei Li a expliqué l’essence du modèle du monde avec l’exemple d’« une tasse posée sur une table » : un modèle qui comprend vraiment le monde doit pouvoir le rendre sous n’importe quel angle, simuler le processus physique lorsqu’il est renversé, et planifier la manière de le saisir avec une main. Ces trois capacités partagent le même « simulateur » sous-jacent. Parallèlement, LeCun estime que les grands modèles de langage sont essentiellement des appariements de motifs statistiques et ne comprennent pas réellement le monde physique. AMI Labs, fondé par LeCun après son départ de Meta, ainsi que World Labs de Fei-Fei Li, ont tous reçu un soutien financier considérable.

La conduite autonome est considérée comme la première « pierre de touche » du modèle du monde. Le modèle du monde prédit les états futurs possibles du monde en se basant sur des séquences d’actions imaginées proposées par l’acteur, ce qui correspond naturellement au cycle « action → prédiction → nouvelle action » des véhicules autonomes.
Le modèle du monde R7 de Momenta, sa solution d’IA physique, est déjà en production de masse, déployé pour la première fois sur le SAIC Volkswagen ID. ERA 9X. Ce modèle a accumulé plus de 12 milliards de kilomètres de conduite réelle, dont plus de 100 millions de segments de « données en or » ont été extraits. Pendant l’entraînement, le modèle R7 peut simuler de manière répétée des situations dangereuses rares dans la réalité et modifier les conditions limites pour un « entraînement supplémentaire », améliorant ainsi ses performances dans des scénarios peu fréquents. Selon les données de CIC Consulter, de mars 2025 à février 2026, sur le marché chinois des fournisseurs tiers de systèmes NOA urbains, la part de marché des ventes de véhicules de série équipés du système Momenta a atteint 65 %. En termes de vitesse, la livraison de 100 000 unités peut être réalisée en moins de 40 jours.
Le PDG de Momenta, Xudong Cao, positionne l’entreprise comme un « constructeur de modèles de base pour l’IA physique ». L’architecture technique de son modèle du monde R7 est divisée en trois couches : la première couche est le pré-entraînement du modèle du monde, qui comprime les lois physiques et les relations de cause à effet dans le modèle ; la deuxième couche est la simulation du modèle du monde, qui effectue des tests en boucle fermée sur des scénarios extrêmes à longue traîne ; la troisième couche est l’apprentissage par renforcement au sein du modèle, qui procède par essais et erreurs répétés via un mécanisme de récompense et de punition, en déduisant dans un monde virtuel.
Le modèle R7 n’est pas simplement un « modèle temps réel embarqué » ou un « grand modèle de base » au sens traditionnel, mais est considéré comme un modèle de base pour l’ère de l’IA physique, fournissant une base pour que l’IA comprenne le monde physique réel. À l’heure actuelle, la conduite autonome est le scénario à plus haute valeur ajoutée permettant de créer une rétroaction positive entre la mise à l’échelle des données et la mise à l’échelle commerciale de l’IA physique.
Selon le prospectus, le chiffre d’affaires de Momenta est passé de 743 millions de yuans en 2023 à 2,413 milliards de yuans en 2025, triplant en trois ans, avec un taux de croissance annuel composé de plus de 80 %. Parmi cela, les revenus du développement technique ont augmenté pour atteindre 1,445 milliard de yuans, tandis que les revenus de licence sont passés de 23 millions de yuans à 968 millions de yuans, multipliés par 42 en trois ans. Les revenus de licence correspondent au modèle de facturation de Momenta pour autoriser les constructeurs automobiles à utiliser son système d’IA physique, avec des caractéristiques de marge bénéficiaire élevée. Ce modèle commercial est considéré comme le modèle de revenus le plus idéal pour les startups de conduite autonome.
Le système technique de Momenta suit un cadre de « un volant, deux jambes », c’est-à-dire un mécanisme central piloté par les données et deux lignes d’activité : l’aide à la conduite de niveau L2 en série et la conduite entièrement autonome de niveau L4. Ces deux jambes partagent la même architecture logicielle, les mêmes solutions de capteurs et le même modèle du monde. Actuellement, plus de 900 000 véhicules de série de niveau L2 fournissent des données de conduite réelles et des revenus commerciaux pour soutenir l’itération du modèle du monde. Le modèle itéré est ensuite déployé sur les Robotaxis de niveau L4, opérant dans des villes comme Shanghai, Suzhou, Munich et Abou Dabi.
L’introduction en bourse de Momenta offre un nouvel étalon pour l’évaluation de la valeur dans le domaine de l’IA physique : pour les entreprises de conduite autonome, il faut évaluer si elles possèdent un modèle de base multimodal ; pour les startups visant directement le « cerveau ultime de l’IA physique », elles doivent répondre aux questions des canaux de déploiement et de la boucle de données fermée. Momenta devient le premier acteur à prouver sa logique commerciale en termes de données opérationnelles et de système technique, mais la question de savoir si son système technique peut être transféré à d’autres terminaux d’IA physique, comme les robots, reste incertaine.
Texte compilé par Wedoany. Toute citation par IA doit mentionner la source « Wedoany ». En cas de contrefaçon ou d'autre problème, veuillez nous en informer rapidement ; nous modifierons ou supprimerons le contenu le cas échéant. Courriel : news@wedoany.com









