Yongsheng Intelligence, filiale de MGI Tech, et le Laboratoire d'Intelligence Artificielle de Shanghai publient un système AI for Bio
2026-07-04 14:17
Favoris

fr.wedoany.com Rapport : Yongsheng Intelligence, filiale de MGI Tech, et le Laboratoire d'Intelligence Artificielle de Shanghai ont conjointement dévoilé deux nouvelles avancées dans le domaine de l'AI for Bio : le système multi-agents ProtoPilot et le cadre d'évaluation complet des agents BioLab Bench, réalisant une boucle fermée complète allant de l'intention expérimentale à l'exécution physique en laboratoire humide.

Actuellement, le secteur de l'AI for Bio attire de nombreuses entreprises technologiques, notamment GPT-Rosalind d'OpenAI, Co-Scientist et ERA de Google, ainsi que le poste de travail Claude Science d'Anthropic. Ces acteurs s'efforcent de faire en sorte que les grands modèles génèrent des protocoles expérimentaux et les exécutent en laboratoire, mais jusqu'à présent, le secteur restait généralement au stade où « l'on peut proposer des protocoles, mais sans obtenir de résultats ». Concrètement, une intention expérimentale doit traverser cinq niveaux de transformation : l'intention scientifique, la conception du protocole, la procédure opératoire standardisée (SOP), le code de l'équipement et l'exécution physique. Une erreur à n'importe quelle étape peut entraîner l'échec de l'expérience.

Le ProtoPilot, dévoilé cette fois-ci, adopte une architecture multi-agents collaborative comprenant l'Orchestrator Agent, le Protocol Expert Agent et le Coding Agent. L'Orchestrator Agent est chargé de coordonner le flux de travail et de décomposer les tâches, le Protocol Expert Agent génère les protocoles expérimentaux et les SOP, tandis que le Coding Agent transforme les protocoles en code exécutable par l'équipement. Le système intègre un validateur qui vérifie la sécurité et l'exécutabilité de chaque ligne de code, et renvoie les causes d'échec, les jugements d'experts et les résultats expérimentaux, créant ainsi une capacité d'apprentissage en boucle fermée.

Sur le benchmark tiers reconnu ProtocolQA, ProtoPilot a obtenu un score de 52,38 % en questions ouvertes, proche du niveau d'expert humain (54 %), et un score de 85,18 % en questions non ouvertes, dépassant le niveau d'expert. À titre de comparaison, le modèle phare actuel d'OpenAI, GPT-5.6 Sol, a obtenu 43,5 % en questions ouvertes. Dans l'évaluation des tâches Protocol, ProtoPilot a obtenu un score global de 94,7 (sur 100), avec 98,9 pour la pertinence des paramètres, 97,7 pour la cohérence méthodologique et 98,4 pour l'exhaustivité du contenu. Lors d'une évaluation en aveugle, trois scientifiques indépendants spécialisés en laboratoire humide, ignorant l'identité du système, ont classé ProtoPilot en première position dans 70,6 % des cas et dans le top trois dans 90,2 % des cas. Pour les tâches de complexité maximale de niveau L3, le taux de réussite de ProtoPilot était de 60 %, tandis que celui du leader du secteur, OpenTrons-AI, était nul.

Dans la phase de conversion en code et d'exécution sur équipement, la qualité médiane du code Protocol2Code de ProtoPilot atteint 95,5, avec un taux de passage de porte (Gate Pass Rate) de 96,6 %. En comparaison, le taux de passage de LabScript-AI est de 64,6 %, celui de Grok-4.3 de 35 %, et celui de GPT-5.5 de 17,7 %. Lors des tests de migration entre équipements, la fluctuation du taux de passage de porte de ce système sur les quatre plateformes principales MGI AlphaTool, Hamilton STAR, OpenTrons OT-2 et Tecan EVO n'était que de 5,9 points de pourcentage. Sur OpenTrons OT-2, le taux de réussite de ProtoPilot était de 88,24 %, contre seulement 32,35 % pour l'IA officielle d'OpenTrons.

BioLab Bench est le premier cadre d'évaluation complet des agents dans le domaine des sciences de la vie, couvrant l'ensemble du processus, du besoin utilisateur à l'exécution par l'équipement. Les tâches sont hiérarchisées par niveau de difficulté de L1 à L3, englobant la compréhension de l'intention expérimentale, Design2Protocol, Protocol2SOP, SOP2Code, le code de l'équipement et l'exécution réelle de l'expérience, avec un support de vérification multiplateforme.

Lors de la validation en laboratoire humide réel, ProtoPilot a réalisé quatre groupes d'expériences de difficulté croissante. Le premier groupe concernait la culture bactérienne sur plaque 96 puits : les 96 puits ont tous montré une croissance, avec des lectures OD600 stables. Le deuxième groupe portait sur 24 PCR de colonies, toutes ayant amplifié les bandes attendues. Le troisième groupe concernait la construction de plasmides et la mutagenèse dirigée : les plasmides GLuc-WT et RLuc-WT ont été construits avec succès, ainsi que 15 mutants validés par séquençage Sanger. Le quatrième groupe portait sur l'assemblage d'ADN basé sur la méthode PCA, impliquant sept étapes opérationnelles, avec un taux de positivité au criblage primaire de 96,9 % (93 clones positifs sur 96 candidats), et le séquençage Sanger a confirmé la construction réussie des quatre séquences d'ADN cibles. De plus, après un échec initial de l'assemblage PCA dû à un problème de sélection par résistance aux antibiotiques, le système a automatiquement analysé la cause et régénéré un protocole corrigé, réussissant au deuxième tour à obtenir des colonies monoclonales isolables et à confirmer par séquençage.

Yongsheng Intelligence, fondée en mars de cette année, est une filiale de MGI Tech spécialisée dans le domaine AI4S. Son équipe a précédemment publié des projets tels qu'EvoPlay et PrimeGen dans des revues affiliées à Nature, et a dirigé le développement du séquenceur flash E25 Flash. MGI Tech possède des produits d'automatisation de laboratoire intelligents tels que PrepALL, AlphaTool et l'intégré AIO. Fin 2025, elle comptait plus de 3 800 clients dans le monde. Les capacités de ProtoPilot et de BioLab Bench ont déjà été réintégrées dans la gamme de produits de Yongsheng Intelligence, fournissant des capacités d'évaluation et de correction pour αLab Brain, tout en permettant aux équipements matériels tels qu'AlphaTool et PrepALL de se connecter à l'écosystème Bio Agent via Protocol2Code.

Article : https://arxiv.org/abs/2606.31763

Ce texte est rédigé, traduit et republié à partir des informations de l'Internet mondial et de partenaires stratégiques, uniquement pour la communication entre lecteurs. En cas d'infraction au droit d'auteur ou d'autres problèmes, veuillez nous en informer à temps pour la modification ou la suppression. La reproduction de cet article est strictement interdite sans autorisation formelle. Mail : news@wedoany.com