fr.wedoany.com Rapport : L'Agence nationale de la société de l'information intelligente (NIA) va investir environ 2,9 milliards de wons pour lancer la construction d'un « système unifié de fourniture de données pour l'apprentissage de l'IA », visant à créer une plateforme unifiée pour les données d'apprentissage de l'intelligence artificielle (IA) actuellement dispersées au niveau national.

Avec la diffusion rapide des technologies d'IA de nouvelle génération telles que l'IA générative, l'IA multimodale et l'IA agentive, l'acquisition de données d'apprentissage à grande échelle et de haute qualité est devenue un enjeu central. Cependant, les données collectées et traitées dans le cadre des projets financés par le gouvernement ne sont souvent pas ouvertes à l'extérieur ni réutilisables, et les données détenues par les entreprises privées et les instituts de recherche restent, en raison d'un manque de processus d'ouverture et de systèmes de soutien, largement confinées à un usage interne. Ce projet est précisément conçu pour résoudre ce problème.
Le cœur de ce projet est la construction d'un système qui prend en charge de manière complète la découverte et l'enregistrement des données d'apprentissage de l'IA, la gestion de la qualité et la désidentification, l'ouverture et la fourniture, ainsi que la recherche et l'utilisation en lien. Le budget du projet est de 2,87918 milliards de wons, et la durée des travaux est de 120 jours à compter de la signature du contrat.
En termes de fonctionnalités spécifiques, le système mettra en place un système de gestion d'enregistrement complet, allant de la réception des demandes d'enregistrement des données d'apprentissage, à l'examen de conformité, l'approbation, la complétion, jusqu'à la suppression. Pour les données déjà enregistrées, il permettra également le suivi de l'état du cycle de vie complet, des versions et de l'historique des modifications, de la génération, l'annotation, la distribution, la mise à jour jusqu'à la suppression.
En ce qui concerne la fonction d'exploration des données, un moteur de recherche sémantique en langage naturel basé sur une base de données vectorielles sera développé, et une interface unique permettra une recherche intégrée des catalogues de données publics et privés externes. En outre, une interface de service lisible par machine sera fournie, permettant aux portails externes ou aux agents d'IA d'interroger et d'utiliser les métadonnées et les conditions d'utilisation des ensembles de données.
Les fonctionnalités et les données de la plateforme AI Hub actuellement gérée par la NIA seront également migrées vers le nouveau système. Les objets de la migration incluent les données, métadonnées, informations historiques et statistiques gérées dans le cadre du système AI Hub et des projets connexes. Au cours du processus de migration, une vérification de cohérence, une élimination des doublons et une correction des erreurs seront effectuées.
Selon le plan, ce système ne sera pas seulement un portail de fourniture de données, mais une plateforme commune de base pour l'écosystème d'utilisation des données, permettant de rechercher, importer, combiner, apprendre et gérer les résultats des données. L'objectif à long terme de la NIA est d'en faire une infrastructure centrale couvrant l'ensemble du cycle de vie de l'écosystème de l'industrie de l'IA, avec la participation de multiples parties prenantes, notamment les entreprises privées, les instituts de recherche et les organismes publics.









