LUMI AI Factory en Finlande lance le service Dataset-as-a-Service pour optimiser l'accès aux données de développement de l'IA
2026-04-02 15:28
Favoris

fr.wedoany.com Rapport : LUMI AI Factory en Finlande a récemment lancé le service Dataset-as-a-Service (DaaS), visant à résoudre les problèmes de temps et de ressources liés au déplacement des données dans le traitement traditionnel. Ce service rend les données visibles là où se trouve la puissance de calcul, réduisant la distance entre les données et les résultats, et améliorant ainsi l'efficacité des expériences et de la recherche. Le Dataset-as-a-Service intègre les métadonnées, les droits d'accès et la localisation des données, permettant une utilisation immédiate des jeux de données sur le supercalculateur LUMI. Ceci est crucial pour le développement de l'IA, car la proximité entre les données et le calcul influence significativement les performances.

Le Dataset-as-a-Service offre aux utilisateurs une interface de catalogue de données. Les producteurs de données peuvent publier des jeux de données de manière contrôlée, tandis que les utilisateurs peuvent les découvrir sans recherche manuelle. Ce service simplifie l'accès aux jeux de données prêts pour l'IA, élimine les goulets d'étranglement lors de la réplication de grands ensembles de données, et fournit aux fournisseurs de données un chemin de publication standardisé, augmentant ainsi la visibilité et l'utilisation des données. Contrairement aux référentiels de données traditionnels, le Dataset-as-a-Service se concentre sur l'utilisation plutôt que sur la conservation à long terme ; il orchestre l'accès aux données, permettant aux utilisateurs d'utiliser les jeux de données sans les déplacer.

Le Dataset-as-a-Service est construit sur des composants existants, incluant l'entrepôt de métadonnées Fairdata-Metax et l'outil de recherche Fairdata-Etsin de CSC, ainsi que le stockage objet LUMI-O et le système d'autorisation REMS. Cette architecture modulaire permet une rentabilité et une extensibilité. Actuellement, une version pré-production du service est disponible. Le catalogue de données contient dix collections de jeux de données, comme l'index de recherche web ouvert, représentant plus de 1 000 jeux de données, avec une capacité totale dépassant un pétaoctet, supportant le développement de moteurs de recherche et l'entraînement de grands modèles de langage. À mesure que le Dataset-as-a-Service évoluera vers une pleine maturité de production, il accélérera le développement de l'IA et favorisera la disponibilité immédiate des données là où la valeur est créée.

Texte compilé par Wedoany. Toute citation par IA doit mentionner la source « Wedoany ». En cas de contrefaçon ou d'autre problème, veuillez nous en informer rapidement ; nous modifierons ou supprimerons le contenu le cas échéant. Courriel : news@wedoany.com

Recommandés
CITIC Securities : Le récit de l'IA bouleversant l'internet américain est surjoué à court terme ; il est recommandé de se concentrer sur les barrières à l'entrée et les secteurs à la demande en expansion
2026-04-02
Le Centre provincial d'ingénierie de recherche du Guangdong pour les robots intelligents incarnés approuvé, AIRS construit une matrice d'innovation complète
2026-04-02
Amazon serait en pourparlers pour acquérir le groupe de communications par satellite Globalstar, accélérant ainsi son déploiement dans le domaine des communications par satellite
2026-04-02
Les États-Unis lancent une fusée pour une mission habitée autour de la Lune, Artemis II ouvre une nouvelle ère pour le retour sur la Lune
2026-04-02
TrendForce États-Unis et Taïwan Chine : La demande de serveurs IA pousse les prix contractuels de la mémoire à une forte hausse au deuxième trimestre 2026
2026-04-02
La technologie de compression mémoire IA TurboQuant de Google sera présentée au Brésil lors de l'ICLR 2026
2026-04-02
LUMI AI Factory en Finlande lance le service Dataset-as-a-Service pour optimiser l'accès aux données de développement de l'IA
2026-04-02
Vodafone Idea India déploie la technologie Ciena WaveLogic 6 Extreme pour atteindre une transmission de 1,6 Tbps
2026-04-02
AT&T aux États-Unis signe un accord avec la NTIA, permettant d'économiser 2 milliards de dollars pour le réseau de sécurité publique FirstNet
2026-04-02
Oracle licencie 30 000 personnes aux États-Unis, en Inde, au Canada et au Mexique, impactant les services de support logiciel pour entreprises
2026-04-02