HiRezo (Japon) : Le développement de l’IA physique nécessite la promotion d’une infrastructure informatique nationale
2026-06-23 16:34
Favoris

fr.wedoany.com Rapport : L’IA physique (Physical AI), définie comme « une technologie permettant à l’IA de reconnaître, comprendre le monde physique, de prendre des décisions et d’agir de manière autonome », suscite un intérêt croissant. Dans ce contexte, la société de développement logiciel Asteria (アステリア) et le fournisseur de services cloud GPU HiRezo (ハイレゾ) ont organisé conjointement un séminaire médiatique le 17 juin 2026, axé sur la construction d’une infrastructure d’IA physique. Nobuhiro Kawamoto, responsable de la stratégie produit et technologique du siège de l’Alliance HiRezo, a souligné lors de la réunion que les données utilisées pour former l’IA sont au cœur de la compétitivité des entreprises, insistant sur le fait que « ces données ne peuvent être confiées à des clouds étrangers », mettant ainsi en évidence l’urgence de développer une infrastructure informatique nationale.

M. Nobuhiro Kawamoto, responsable de la stratégie produit et technologique du siège de l’Alliance HiRezo

Nobuhiro Kawamoto a retracé l’évolution de l’intelligence des robots dans la résolution de problèmes en environnement réel. La première génération reposait entièrement sur des programmes écrits manuellement pour décrire les actions, adaptée aux environnements standardisés comme les usines, mais incapable de faire face à des scénarios imprévisibles tels que les foyers ou les routes. À partir de 2012 environ, la deuxième génération, s’appuyant sur l’apprentissage profond et l’apprentissage par renforcement, a permis un apprentissage autonome : les robots apprennent à reconnaître des objets grâce à de grandes quantités de données d’images et améliorent leurs capacités par essais et erreurs. Cependant, faute de comprendre le monde de manière fondamentale, ils nécessitent encore un nombre considérable de tentatives.

Dans la troisième génération, « comprendre et agir » s’enchaîne de manière continue

Kawamoto a souligné qu’actuellement, la troisième génération, grâce à l’introduction de la technologie Transformer, forme un modèle VLA (Vision-Langage-Action) intégrant la vision, le langage et l’action. Les robots sont désormais capables de comprendre des instructions linguistiques comme « prendre une tasse » et commencent à utiliser les connaissances générales disponibles sur Internet pour traiter des objets rencontrés pour la première fois.

Texte compilé par Wedoany. Toute citation par IA doit mentionner la source « Wedoany ». En cas de contrefaçon ou d'autre problème, veuillez nous en informer rapidement ; nous modifierons ou supprimerons le contenu le cas échéant. Courriel : news@wedoany.com

Produits Associés