fr.wedoany.com Rapport : Databricks et Nvidia ont conjointement lancé un projet open source baptisé Genesis Workbench, visant à résoudre le problème de la difficulté de coordination entre les modèles d'IA et les données d'entreprise ainsi que l'infrastructure de calcul lors du déploiement d'applications d'IA dans le domaine des sciences de la vie.
Dans la recherche de découverte de médicaments, les données de recherche internes, les résultats de laboratoire et les ressources GPU des entreprises sont généralement dispersés dans des environnements indépendants, ce qui complique la collaboration et la reproductibilité des résultats. Parallèlement, le nombre de modèles d'IA ne cesse d'augmenter, et la manière d'intégrer ces modèles aux données propriétaires et aux flux de travail de recherche existants constitue un défi concret pour les entreprises pharmaceutiques et biotechnologiques. Genesis Workbench n'introduit pas de nouveaux modèles, mais intègre les données d'entreprise, les modèles BioNeMo de Nvidia et l'infrastructure GPU dans un environnement unifié de Databricks, aidant ainsi les chercheurs à passer de la configuration des flux de travail d'IA à leur application pratique.
Cette plateforme se concentre sur l'ensemble du processus de découverte de médicaments, en regroupant les outils de génomique, d'analyse unicellulaire, d'ingénierie des protéines et de conception de petites molécules sous une seule plateforme, une seule interface utilisateur et un seul modèle de gouvernance. Selon Databricks, en utilisant Databricks AI Search pour centraliser les ensembles de données publics et propriétaires, il est possible d'éliminer la dépendance aux API externes, permettant ainsi une transition fluide de la découverte génomique vers la validation unicellulaire, la prédiction de la structure des cibles, le docking des candidats, le classement ADMET, etc. La plateforme repose sur des modèles open source gérés via Unity Catalog, utilise MLflow pour suivre les expériences et s'appuie sur des services de modèles soutenus par GPU pour le traitement des inférences. Nvidia a contribué avec la BioNeMo Agent Toolkit, Parabricks et d'autres technologies, ainsi qu'une combinaison de modèles biologiques et chimiques.
Une caractéristique notable de Genesis Workbench est qu'il fonctionne entièrement dans l'environnement Databricks du client, ce qui permet aux organisations de conserver les données de recherche sensibles dans le cadre de leurs contrôles de gouvernance existants, sans avoir à les envoyer à des services d'IA tiers. Avec le développement de l'IA biologique, la plateforme prend en charge une extension flexible, permettant aux organisations d'ajouter ou de remplacer des modules individuels sans avoir à reconstruire l'ensemble de l'environnement de recherche.

La recherche en sciences de la vie couvre plusieurs disciplines telles que la génomique, la biologie structurale, la chimie et les données cliniques, et doit traiter des données hautement réglementées et propriétaires. Construire des applications d'IA dans un tel environnement nécessite non seulement une puissance de calcul brute, mais aussi un accès sécurisé aux données et la flexibilité d'intégrer de nouveaux modèles. Pour Databricks, Genesis Workbench est un exemple de son passage de l'analyse à des applications d'IA approfondies basées sur le lakehouse ; Nvidia, quant à elle, en profite pour placer BioNeMo et les logiciels de calcul accéléré au cœur des flux de travail de découverte de médicaments en entreprise.









