fr.wedoany.com Rapport : Lambda, un fournisseur de services cloud soutenu par Microsoft, a obtenu un accès anticipé au commutateur réseau à photonique intégrée (CPO) de NVIDIA, qui sera bientôt lancé, et l'a présenté au public. Ce matériel est désormais en « production à grande échelle », et Lambda prévoit de l'utiliser dans son système de cluster GB300 NVL72.
Ce commutateur fait partie de la série Quantum-X Q3450-LD, basée sur l'architecture InfiniBand. Il adopte un format 4U, peut accueillir 144 ports 800G et offre une capacité de commutation non bloquante de 115,2 térabits par seconde (Tb/s). L'équipement utilise un refroidissement liquide, avec deux boucles internes et quatre interfaces de refroidissement liquide UDQ4. NVIDIA a recours à la technologie photonique sur silicium pour améliorer la bande passante et les performances de connexion entre les serveurs dans les grands clusters de GPU.
L'équipe d'ingénierie de Lambda souligne que l'un des principaux avantages du commutateur CPO est l'économie d'énergie. Les commutateurs traditionnels nécessitent un grand nombre d'émetteurs-récepteurs enfichables, tandis que le commutateur CPO intègre les moteurs optiques à l'intérieur de quatre ASIC, éliminant ainsi ces composants. Le commutateur utilise des réseaux de fibres pour les connexions, et fournit des signaux aux ports MPO (Multi-fiber Push-On) via 18 modules de source lumineuse amovibles. Cela réduit considérablement le chemin du circuit entre les composants optiques et l'ASIC, ce qui contribue à diminuer la latence et à réduire la perte de signal. Rich Underwood, architecte de systèmes HPC chez Lambda, donne l'exemple d'un commutateur traditionnel à 72 ports nécessitant 72 émetteurs-récepteurs, chacun consommant 25 watts. La solution CPO permet de réduire considérablement la consommation d'énergie. Ashkan Seyedi, directeur réseau chez NVIDIA, explique le fonctionnement du CPO, soulignant que les signaux électriques sont immédiatement convertis dans le domaine optique sur le boîtier, réduisant ainsi la longueur des voies électriques. Il insiste sur le fait que la réduction du nombre de lasers, la suppression des processeurs de signaux numériques (DSP) et la garantie de la propreté des fibres accélèrent la mise en place du système.
Outre l'avantage en termes de consommation d'énergie, l'équipe de Lambda estime que la technologie CPO peut également améliorer la fiabilité du réseau, car la suppression des émetteurs-récepteurs élimine un point de défaillance potentiel. Underwood estime que, dans un cluster de super intelligence cloud de 128 000 GPU, la solution traditionnelle nécessiterait 5 millions de lasers, tandis que la solution CPO n'en nécessite qu'un million. Les économies d'énergie se traduisent directement par davantage de GPU disponibles et de temps de calcul. TSMC fabrique pour NVIDIA les versions CPO des commutateurs Quantum-X et Spectrum-X basés sur Ethernet, les deux entreprises collaborant à la production de circuits photoniques intégrés.
Malgré l'adoption du CPO, NVIDIA prévoit de continuer à utiliser le cuivre. Son PDG, Jensen Huang, a confirmé lors de son discours d'ouverture au GTC que le cuivre aura sa place dans ses solutions d'interconnexion, y compris dans la prochaine architecture Feynman. Gilad Shainer, vice-président senior du réseau chez NVIDIA, explique que l'utilisation simultanée des deux technologies vise à « faire la bonne conception » et précise que la transmission par cuivre a une consommation d'énergie nulle et est passive, et qu'il faut donc privilégier le cuivre chaque fois que possible.










