fr.wedoany.com Rapport : La société de robotique basée à Shenzhen, X Square Robot, a dévoilé XRZero-G0, un cadre matériel et logiciel open source conçu pour collecter des données d’entraînement robotique à partir d’opérateurs humains, générer des stratégies et les tester sur des robots physiques. Le code est publié sous licence MIT et hébergé sur GitHub, accompagné de l’ensemble de données G0-Dataset.

Les méthodes traditionnelles reposent sur des robots physiques pour collecter des échantillons d’entraînement, chaque session d’opération ne produisant qu’une quantité très limitée de données de démonstration, ce qui restreint directement la taille des ensembles de données nécessaires à l’entraînement de l’IA incarnée. Les démonstrateurs humains offrent une source de données à moindre coût, et X Square Robot a intégré cette approche dans un système accessible au public. L’entreprise développe des robots destinés aux tâches de travail physique ; auparavant, ces sociétés devaient consacrer beaucoup de temps et d’argent à manipuler manuellement les machines pour collecter des échantillons d’entraînement.
Les robots physiques perçoivent leur environnement via plusieurs caméras. Une caméra montée sur la tête capture la scène dans son ensemble, tandis que des caméras montées sur les poignets enregistrent en détail les interactions entre les mains et les objets. De nombreux dispositifs de collecte à commande manuelle ne s’appuient que sur la vue du poignet, ce qui entraîne un décalage entre les données d’entraînement et la manière dont le robot perçoit réellement lors de son déploiement. XRZero-G0 utilise une caméra montée sur la tête et deux caméras de poignet pour enregistrer simultanément un large contexte de scène et des manipulations fines à courte distance, et mappe ces perspectives dans une représentation partagée correspondant à la perception du robot. Associé à une interface VR portable et à des pinces interchangeables, un seul opérateur peut produire des données de démonstration adaptées à différents corps de robots.
Les données provenant de démonstrateurs humains présentent des problèmes de qualité qui peuvent affecter leur valeur d’entraînement. XRZero-G0 construit un processus en boucle fermée comprenant la collecte, l’inspection, l’entraînement et l’évaluation, afin de filtrer les échantillons entrant dans la phase d’entraînement. Au niveau de l’observation, les contraintes de cohérence géométrique multi-vues réduisent les décalages entre les images et les mouvements ; au niveau cinématique, un algorithme de cinématique inverse corps entier avec contraintes de collision et de limites articulaires élimine les trajectoires invalides ; au niveau stratégique, l’exécution de replay sur le robot physique sert de validation finale. Selon X Square Robot, dans des conditions contrôlées, le rendement en données utiles du système approche les 85 %.
L’entreprise indique que les données sans robot et celles issues de robots réels peuvent fonctionner en synergie. En combinant environ 10 segments de démonstration collectés par des humains avec un segment enregistré par un robot réel, on atteint, dans les tâches de test, des performances comparables à celles d’un ensemble d’entraînement composé uniquement de données de robots réels. Les données collectées par les humains offrent une large couverture comportementale, tandis qu’une petite quantité de données de robots réels sert à ancrer des paramètres physiques tels que les retards moteurs et les frottements. Dans les conditions de test, ce rapport réduit jusqu’à 20 fois la quantité de données de robots réels nécessaires.
L’ensemble de données G0-Dataset contient plus de 2 000 heures de démonstrations validées, couvrant les modalités visuelles, tactiles et auditives, et inclut 3 000 tâches opérationnelles différentes, avec une distribution suivant une caractéristique de longue traîne. Le taux de collecte maximal d’un opérateur atteint 93,2 segments par heure. Cet ensemble de données prend en charge le pré-entraînement à grande échelle et la recherche sur le transfert entre différents corps de robots. X Square Robot indique que les stratégies entraînées sur ce cadre peuvent se généraliser à des environnements de collecte présentant différentes postures de robots, hauteurs de table et angles de vue, et démontrent une capacité de transfert zéro-shot vers des plateformes robotiques non incluses dans l’ensemble d’entraînement, permettant d’exécuter des tâches sans nécessiter de réglage fin pour la nouvelle plateforme.
Texte compilé par Wedoany. Toute citation par IA doit mentionner la source « Wedoany ». En cas de contrefaçon ou d'autre problème, veuillez nous en informer rapidement ; nous modifierons ou supprimerons le contenu le cas échéant. Courriel : news@wedoany.com









