fr.wedoany.com Rapport : La start-up britannique de réseaux photoniques Oriole Networks déploiera le premier réseau photonique d'IA pure à grande échelle au monde pour l'ARIA Scaling Inference Lab au Royaume-Uni. Ce système combinera la technologie de réseau photonique d'Oriole avec les GPU AMD Instinct et les CPU AMD EPYC pour valider les capacités de la prochaine génération d'infrastructure d'IA en matière de débit d'inférence, de faible latence et de contrôle de la consommation énergétique.
Le goulot d'étranglement des centres de données d'IA passe des performances d'une seule puce à l'interconnexion réseau au sein du cluster. L'inférence et l'entraînement des grands modèles nécessitent la collaboration d'un grand nombre de GPU, CPU, mémoire et systèmes de stockage. La vitesse de transfert des données, la latence et la consommation énergétique entre les nœuds affectent directement l'efficacité globale. Les réseaux de centres de données traditionnels dépendent fortement des équipements de commutation électrique. À mesure que la taille des clusters d'IA augmente, la consommation électrique de la couche de commutation, la congestion des liaisons et le temps d'attente des GPU deviennent des facteurs limitants. La solution d'Oriole remplace une partie des chemins de commutation électrique traditionnels par un réseau photonique pur, visant à réduire la latence et la consommation énergétique au niveau système, permettant ainsi à davantage de ressources de calcul d'être réellement utilisées pour les tâches d'IA.
Ce déploiement dans l'ARIA Scaling Inference Lab constitue une étape importante de validation commerciale pour le réseau photonique d'IA d'Oriole. Ce laboratoire se concentre sur les problèmes d'extension de l'inférence d'IA, en étudiant comment faire fonctionner les grands modèles dans une infrastructure à moindre coût, plus efficace et plus interactive.
Oriole a précédemment lancé l'infrastructure de routage photonique PRISM, conçue pour les centres de données, le calcul haute performance et les charges de travail d'apprentissage profond distribué. L'approche de PRISM consiste à utiliser un réseau de commutation photonique pour répondre aux besoins d'interconnexion à haut débit dans les clusters d'IA, réduisant ainsi la pression sur la consommation énergétique et la latence causée par la commutation électrique. Si cette technologie s'avère efficace dans un environnement de laboratoire, elle influencera à l'avenir la conception des réseaux de serveurs d'IA, des modules d'interconnexion optique, des architectures de commutation des centres de données, du déploiement des clusters GPU et des réseaux de calcul haute performance. La participation d'AMD à ce déploiement montre également que les fabricants de puces d'IA s'intéressent désormais aux goulots d'étranglement de performance au niveau système au-delà des puces de calcul. La pleine exploitation de la puissance de calcul des GPU dépend de plus en plus de la coopération entre le réseau, la mémoire, l'encapsulation, le refroidissement et l'ordonnancement logiciel.
Ce déploiement reste actuellement un projet de démonstration et de validation pour le laboratoire ARIA, et ne correspond pas à un déploiement commercial à grande échelle dans les centres de données. Oriole considère ce projet comme son premier déploiement commercial et prévoit de promouvoir des applications industrielles plus larges d'ici 2027. Les prochaines étapes se concentreront sur la validation des performances réelles de débit, de la stabilité du réseau, de la compatibilité avec les clusters de serveurs d'IA, des coûts de déploiement, de la complexité de maintenance et de l'efficacité énergétique.










