La Fondation LF AI & Data des États-Unis crée un groupe de travail pour élaborer une norme de documents natifs de l'IA
2026-06-10 13:40
Favoris

fr.wedoany.com Rapport : La Fondation LF AI & Data, sous l'égide de la Linux Foundation, a créé un groupe de travail dédié au développement de la spécification DocLang, visant à fournir une norme interopérable de traitement de documents pour les flux de travail transversaux à l'IA et aux agents intelligents.

Ordinateur portable IA

Ce groupe de travail, fondé par les membres principaux IBM, Nvidia et Red Hat, a pour mission de créer un format de document ouvert, universel et natif de l'IA, visant à améliorer la manière dont les entreprises préparent, échangent et gèrent les données documentaires pour les systèmes d'IA. Les contributeurs ABBYY et Human Signal participeront également à son développement.

Selon l'annonce, les entreprises évoluent actuellement dans un environnement de formats de documents fragmentés, notamment PDF, JPEG et d'autres types de fichiers principalement conçus pour la lecture humaine plutôt que pour l'interprétation par l'IA. Alors que les organisations s'appuient de plus en plus sur l'IA générative et les systèmes d'agents, ce décalage peut introduire de la complexité, augmenter les coûts et réduire la fiabilité lors de l'extraction de sens à partir de documents métier.

Mark Collier, directeur exécutif de LF AI & Data, a déclaré que l'objectif du groupe de travail sur la spécification DocLang est d'élaborer une norme neutre vis-à-vis des fournisseurs et interopérable, aidant les organisations à préparer les données documentaires pour l'IA de manière plus fiable, transparente et à grande échelle. Un document d'information publié par le groupe de travail indique que le PDF est conçu pour l'impression, le DOCX pour les éditeurs, et que DocLang est conçu pour la prochaine ère : une norme de document lisible par machine que les modèles peuvent vraiment truster. DocLang définit un format structuré et lisible par machine pour tout type de document, comme le JSON pour les données ou le HTML pour le web, que tout outil peut implémenter et que toute pipeline peut utiliser.

Carmi Levy, analyste technologique indépendant, a déclaré que les normes de documents existantes ont permis aux parties prenantes mondiales de collaborer en toute confiance pendant des décennies, mais qu'avec l'IA qui redéfinit les règles du travail, ces normes ont un besoin urgent de mise à jour. Il estime que DocLang représente le plus grand et le plus précoce espoir d'établir une base de référence fondamentale en matière de normes de documents, promettant de rendre les flux de travail plus intelligents, plus efficaces et moins risqués qu'aujourd'hui. L'adoption d'une approche open source et neutre vis-à-vis des fournisseurs garantit que les intérêts collectifs priment sur les besoins spécifiques des fournisseurs, et les premiers travaux de normalisation autour du web, des documents, des pages web et du cloud ont façonné le paysage numérique fluide qui définit la vie moderne.

Jason Andersen, analyste principal chez Moor Insights & Strategy, estime que lorsque des normes comme DocLang sont appliquées à l'ingestion de contenu, les utilisateurs téléchargeant un document vers un agent peuvent exécuter une compétence pour prétraiter le document au format standard DocLang, économisant ainsi des tokens. Il envisage que ces normes doivent permettre aux humains de faire ce qu'ils veulent sans avoir besoin de connaître le codage pour les utiliser avec compétence. Une fois que le prétraitement attache des métadonnées ou du code au document, la gouvernance pourrait être plus facile à réaliser si elle est correctement maintenue, mais cela n'est pas encore reflété dans la spécification, et il encourage l'équipe à y réfléchir.

Yaz Palanichamy, analyste de recherche senior chez Info-Tech Research Group, a déclaré que le concept de document natif de l'IA, du point de vue de la productivité des utilisateurs, aide les organisations à préparer les données documentaires pour les systèmes intégrés à l'IA. Cependant, il a souligné que les contrôles de conformité organisationnels et le modèle de gouvernance global sont absolument nécessaires, et qu'il faut également comprendre si la préparation technologique de l'entreprise permet de standardiser les pratiques internes de gestion documentaire. Sans étude de faisabilité interne ou préparation préalable, la gestion du changement ne peut être correctement exécutée, ce qui pourrait entraver la capacité de l'organisation à mûrir ou à étendre ses capacités de traitement documentaire intégré à l'IA. Du point de vue de la gouvernance, plusieurs mesures de contrôle organisationnel doivent encore être examinées de manière appropriée pour garantir que cette nouvelle norme et boîte à outils collaborative soit déployée de manière responsable et sécurisée.

Texte compilé par Wedoany. Toute citation par IA doit mentionner la source « Wedoany ». En cas de contrefaçon ou d'autre problème, veuillez nous en informer rapidement ; nous modifierons ou supprimerons le contenu le cas échéant. Courriel : news@wedoany.com