LUMI AI Factory en Finlande lance le service Dataset-as-a-Service pour optimiser l'accès aux données de développement de l'IA
2026-04-02 15:28
Favoris

fr.wedoany.com Rapport : LUMI AI Factory en Finlande a récemment lancé le service Dataset-as-a-Service (DaaS), visant à résoudre les problèmes de temps et de ressources liés au déplacement des données dans le traitement traditionnel. Ce service rend les données visibles là où se trouve la puissance de calcul, réduisant la distance entre les données et les résultats, et améliorant ainsi l'efficacité des expériences et de la recherche. Le Dataset-as-a-Service intègre les métadonnées, les droits d'accès et la localisation des données, permettant une utilisation immédiate des jeux de données sur le supercalculateur LUMI. Ceci est crucial pour le développement de l'IA, car la proximité entre les données et le calcul influence significativement les performances.

Le Dataset-as-a-Service offre aux utilisateurs une interface de catalogue de données. Les producteurs de données peuvent publier des jeux de données de manière contrôlée, tandis que les utilisateurs peuvent les découvrir sans recherche manuelle. Ce service simplifie l'accès aux jeux de données prêts pour l'IA, élimine les goulets d'étranglement lors de la réplication de grands ensembles de données, et fournit aux fournisseurs de données un chemin de publication standardisé, augmentant ainsi la visibilité et l'utilisation des données. Contrairement aux référentiels de données traditionnels, le Dataset-as-a-Service se concentre sur l'utilisation plutôt que sur la conservation à long terme ; il orchestre l'accès aux données, permettant aux utilisateurs d'utiliser les jeux de données sans les déplacer.

Le Dataset-as-a-Service est construit sur des composants existants, incluant l'entrepôt de métadonnées Fairdata-Metax et l'outil de recherche Fairdata-Etsin de CSC, ainsi que le stockage objet LUMI-O et le système d'autorisation REMS. Cette architecture modulaire permet une rentabilité et une extensibilité. Actuellement, une version pré-production du service est disponible. Le catalogue de données contient dix collections de jeux de données, comme l'index de recherche web ouvert, représentant plus de 1 000 jeux de données, avec une capacité totale dépassant un pétaoctet, supportant le développement de moteurs de recherche et l'entraînement de grands modèles de langage. À mesure que le Dataset-as-a-Service évoluera vers une pleine maturité de production, il accélérera le développement de l'IA et favorisera la disponibilité immédiate des données là où la valeur est créée.

Texte compilé par Wedoany. Toute citation par IA doit mentionner la source « Wedoany ». En cas de contrefaçon ou d'autre problème, veuillez nous en informer rapidement ; nous modifierons ou supprimerons le contenu le cas échéant. Courriel : news@wedoany.com

Produits Associés
Recommandés
SMIC, Hua Hong Group et d'autres entreprises chinoises s'associent pour créer le Centre international de la chaîne d'approvisionnement en matériaux électroniques de Shanghai, avec un capital social de 200 millions de yuans
2026-05-20
TSMC Chine annonce un taux de rendement supérieur à 98 % pour son packaging avancé CoWoS, les produits au format de réticule 5,5x sont en production de masse
2026-05-20
GITAI USA étend ses services de robotique spatiale et fait progresser les opérations en orbite et la construction d'infrastructures lunaires
2026-05-20
Le fournisseur américain de fibre noire BIG Fiber obtient un financement par emprunt de 250 millions de dollars pour accélérer l'expansion de l'infrastructure d'IA à Atlanta et dans la baie de San Francisco
2026-05-20
Aramco et Pasqal lancent en Arabie saoudite une plateforme commerciale de calcul quantique en tant que service
2026-05-20
La société canadienne d'informatique quantique Nord Quantique lève 30 millions de dollars pour une valorisation de 1,4 milliard de dollars
2026-05-20
Le MIT développe une micropuce résistant aux attaques quantiques, offrant une sécurité post-quantique aux dispositifs biomédicaux sans fil
2026-05-20
Une équipe de l'Université de Tokyo au Japon développe une technologie de commutation ultrarapide à faible consommation d'énergie
2026-05-20
L'américain LaunchDarkly lance la solution AgentControl pour offrir un contrôle en temps réel des agents IA en environnement de production
2026-05-20
L'Académie chinoise des technologies de l'information et de la communication (CAICT), en collaboration avec ICBC, China Mobile et d'autres entreprises, a élaboré une série de normes intitulée « Modèle de maturité des capacités de la plateforme de données », fournissant une référence technique pour la transformation numérique et intelligente des gouvernements et des entreprises.
2026-05-20