GitHub lance Qubot, un agent d'analyse IA interne, prenant en charge les requêtes en langage naturel
2026-06-21 10:12
Favoris

fr.wedoany.com Rapport : GitHub a lancé Qubot, un agent d'analyse intelligence artificielle interne, conçu pour permettre aux employés d'interroger n'importe quel modèle de données dans l'entrepôt de données en langage naturel et d'obtenir une réponse en quelques secondes.

Les grandes organisations de données et d'analyse ont souvent du mal à offrir un accès en libre-service aux données et aux informations. GitHub compte des dizaines d'équipes produits en interne, et leur fournir un support d'analyse dédié est un défi. Par conséquent, de nombreuses équipes doivent résoudre elles-mêmes leurs problèmes d'analyse de données. Bien qu'il existe une grande quantité de données de télémétrie produit précieuses pour la prise de décision, déterminer le modèle de données, la granularité, les filtres, rédiger des requêtes et valider les résultats reste une tâche difficile sans le soutien d'un analyste de données.

Qubot, en tant qu'agent d'analyse interne basé sur GitHub Copilot, permet à tout Hubber (c'est-à-dire un employé de GitHub) de poser des questions en langage naturel, par exemple « Quel groupe d'utilisateurs a le taux de rétention le plus élevé pour cette fonctionnalité ? » ou « Quel produit a le plus contribué à l'amélioration de cet indicateur la semaine dernière ? ». Cet outil ne remplace pas les outils de reporting ou les tableaux de bord, mais convient aux questions exploratoires, avec un coût de maintenance nul, et aide les équipes à se familiariser rapidement avec des ensembles de données inconnus.

L'architecture de Qubot comprend trois composants principaux : l'interface utilisateur, la couche de contexte et le moteur de requêtes.

Schéma illustrant l'architecture de l'agent d'analyse Qubot. Le contexte et les entrées utilisateur alimentent Qubot, qui consulte Trino et Kusto pour obtenir des réponses.

L'interface utilisateur est accessible via Slack, VS Code et le CLI Copilot. L'interface Slack ne nécessite aucune configuration : lorsqu'une personne pose une question dans le canal Slack Qubot, le système génère une instance Qubot, la réponse s'affiche directement dans Slack, et l'utilisateur peut partager les résultats et itérer pour affiner la question. Les résultats sont également stockés sous forme de rapports Markdown dans les pull requests. Qubot est utilisable après installation en tant que plugin dans VS Code et le CLI Copilot.

La couche de contexte est construite de manière fédérée, avec des connaissances adaptées au type de données. Pour les données d'événements brutes (couche bronze), elle dispose du contexte de télémétrie fourni par les équipes produit ; pour les données de faits et de dimensions (couche argent), elle possède des exemples de requêtes et des guides d'utilisation maintenus par l'équipe données et analyse ; pour les données de la couche or, organisées pour des cas d'usage métier spécifiques, elle intègre des règles métier et des définitions d'indicateurs. Le pipeline ETL enrichit la couche de contexte avec des signaux supplémentaires et des métadonnées dérivées, et celle-ci est chargée à l'exécution via le serveur MCP de GitHub.

L'agent de contexte simplifie la contribution fédérée au contexte. Les équipes peuvent contribuer au contexte via des modèles standardisés ou des référentiels, et l'agent ingère, organise et normalise les informations dans un format structuré. Chaque modification de la couche de contexte ou de la configuration de l'agent est mesurée avant publication via un cadre d'évaluation, qui comprend des cas de test soigneusement conçus, une orchestration d'exécution automatique et des composants d'agrégation statistique, afin de mesurer la précision des réponses, la latence et de détecter les régressions.

Le moteur de requêtes se connecte à Kusto et Trino via le serveur MCP. Kusto est rapide et adapté aux requêtes exploratoires sur des données d'événements récentes ; Trino gère les jointures complexes et les analyses historiques plus approfondies. Qubot utilise Kusto par défaut et bascule automatiquement vers Trino si nécessaire.

Qubot est largement utilisé chez GitHub, avec des centaines d'utilisateurs ayant exécuté des milliers de requêtes. Le nombre de questions dans les canaux de données et d'analyse a considérablement diminué, permettant aux employés d'explorer les données de manière plus autonome. La couche de contexte est devenue essentielle pour améliorer les capacités de raisonnement de Copilot : un contexte bien structuré rend non seulement Qubot plus précis, mais peut également tripler la vitesse d'obtention de réponses correctes.

Texte compilé par Wedoany. Toute citation par IA doit mentionner la source « Wedoany ». En cas de contrefaçon ou d'autre problème, veuillez nous en informer rapidement ; nous modifierons ou supprimerons le contenu le cas échéant. Courriel : news@wedoany.com