L’américain Tensordyne Napier 13 fois plus performant que le GB300, commandes dépassant 200 millions de dollars

2026-06-16 09:45

Favoris

fr.wedoany.com Rapport : La société Tensordyne (anciennement Recogni, fondée en 2017) annonce que son accélérateur IA « Napier » a terminé sa phase de tape-out. Cette puce doit son nom à John Napier, l’inventeur des logarithmes, et son innovation clé consiste à utiliser les mathématiques logarithmiques pour convertir les multiplications massives des opérations des modèles d’IA en additions.

Étant donné que les additions sont plus efficaces, Tensordyne affirme que les performances de calcul d’un seul rack Napier dépassent largement celles des serveurs IA utilisant la technologie GB300 de Nvidia. Selon le modèle d’IA, un rack Napier peut traiter jusqu’à 13 fois plus de tokens par seconde que le Nvidia GB300 NVL72. En termes d’efficacité mesurée en tokens par watt par seconde, l’amélioration pourrait même atteindre 17 fois.

La société révèle que le système Napier a déjà reçu des commandes d’une valeur totale supérieure à 200 millions de dollars, mais n’a pas encore communiqué la date de livraison du premier Pod TDN72. Nvidia prévoit de lancer son système Groq 3 LPX, optimisé pour l’inférence, d’ici fin 2026, tandis que le projet Rubin CPX, également destiné à l’inférence et annoncé précédemment, semble avoir été mis en suspens.

Grâce à la méthode de calcul logarithmique, les unités de calcul réelles du Napier peuvent être conçues plus petites, permettant d’intégrer davantage de cœurs sur la puce et d’accueillir une SRAM haute vitesse. Chaque puce Napier est équipée de 144 Go de mémoire HBM3E et intègre une interconnexion ultra-rapide. Un Pod TDN72 est composé de quatre emplacements de rack étroitement connectés, chaque emplacement contenant 9 puces Napier. Un rack complet Tensordyne Napier est constitué de quatre Pods TDN72, intégrant au total 288 puces Napier.

Un seul rack TDN offre une puissance de calcul de 608 PFlops, avec 42 To de HBM3E, 78 Go de SRAM et 256 To de RAM. Sa consommation électrique maximale est de 120 kW, il prend en charge le refroidissement par air, et le débit d’interconnexion interne du rack atteint 275 To/s.

La puce Napier peut traiter des formats de données tels que FP16, FP8, FP4 et Int8. Selon Tensordyne, cette puce est adaptée aux modèles d’IA courants comme Kimi K2.6, DeepSeek-R1/V4 Pro, Llama3.1 405B, Mixtral 8x22B, GPT-OSS-120B et Qwen 80B. À titre de comparaison, Nvidia prévoit d’installer 256 puces Groq-3-LPU dans un seul rack Groq-3-LPX, chaque LPU étant dotée de 500 Mo de SRAM, pour un total de 128 Go de SRAM et 12 To de RAM DDR5 par rack.

Le siège social de Tensordyne se trouve dans la Silicon Valley, avec une filiale à Munich. Plusieurs de ses développeurs seniors travaillaient auparavant chez Juniper Networks (désormais intégré à HPE). Lors du développement de la puce Napier, Tensordyne a collaboré avec Broadcom, qui développe également des puces IA pour plusieurs générations de TPU de Google.

Texte compilé par Wedoany. Toute citation par IA doit mentionner la source « Wedoany ». En cas de contrefaçon ou d'autre problème, veuillez nous en informer rapidement ; nous modifierons ou supprimerons le contenu le cas échéant. Courriel : news@wedoany.com