Etched, une entreprise américaine, obtient 800 millions de dollars de financement et signe 1 milliard de dollars pour lancer un système d'inférence IA
2026-07-01 10:43
Favoris

fr.wedoany.com Rapport : La société Etched a récemment présenté publiquement une puce d'inférence IA opérationnelle et a révélé avoir signé des contrats clients d'une valeur totale supérieure à 1 milliard de dollars. L'entreprise a levé 800 millions de dollars lors de plusieurs tours de financement non divulgués auparavant, le dernier tour ayant été finalisé en décembre 2025, levant 500 millions de dollars pour une valorisation post-investissement de 5 milliards de dollars. Les investisseurs incluent VentureTech Alliance, Peter Thiel, Jane Street, Hudson River Trading, Jump Trading, Two Sigma, Stripes, Ribbit Capital, Radical Ventures, Primary VC, Positive Sum, ainsi que de nombreux chercheurs et entrepreneurs renommés en IA. Etched indique que sa puce a réussi sa première mise en circuit (A0) sur le procédé N4P de TSMC et prévoit de commencer à expédier son premier système d'inférence en rack cet été.

Cette entreprise, fondée il y a moins de trois ans, se consacre à la construction d'une infrastructure d'inférence IA verticalement intégrée, couvrant les puces sur mesure, les racks, le réseau, le refroidissement, les logiciels et la fabrication. Son système fait déjà fonctionner des modèles d'IA de production, notamment DeepSeek, Qwen, Mamba et Llama, et prend en charge des architectures allant des systèmes denses aux systèmes massifs à mélange d'experts (MoE) avec un nombre arbitrairement élevé de paramètres. Pour garantir sa capacité de fabrication, Etched a ouvert une usine à Taïwan, tout en construisant un centre de données de 2 mégawatts, des salles de test et un laboratoire de prototypage pour l'introduction de nouveaux produits (NPI) à son siège de San José, avec pour objectif de réaliser des déploiements à l'échelle du gigawatt à partir de 2027.

Etched a également dévoilé deux technologies d'architecture différenciées. La technologie d'inférence basse tension (LVI) réduit la tension du réseau de calcul de la puce à moins de la moitié de celle des accélérateurs d'IA traditionnels, ce qui, selon l'entreprise, permet d'atteindre une utilisation soutenue de plus de 80 % des FLOPs de pointe dans l'inférence MoE clairsemée à des billions de paramètres, sans limitation thermique. L'architecture de mémoire au niveau du cluster (CSM) combine la HBM avec une mémoire partagée à faible latence connectée via des interconnexions propriétaires, visant à réduire la latence d'inférence tout en maintenant un débit élevé. Selon Etched, les tests clients précoces ont déjà démontré un débit, une latence et une efficacité énergétique de pointe pour les charges de travail d'inférence, et davantage de données de performance devraient être publiées plus tard cet été.

Les étapes clés du développement incluent : la levée de 800 millions de dollars lors de plusieurs tours de financement, le dernier tour ayant levé 500 millions de dollars en décembre 2025 pour une valorisation de 5 milliards de dollars ; la signature de contrats clients d'une valeur totale supérieure à 1 milliard de dollars ; le succès de la première mise en circuit sur le procédé N4P de TSMC ; la première expédition de systèmes d'inférence en rack prévue pour l'été 2026 ; le système pouvant désormais faire fonctionner des modèles tels que DeepSeek, Qwen, Mamba et Llama ; la construction d'un centre de données de 2 mégawatts, d'installations de test et d'un laboratoire de prototypage NPI à San José, ainsi que d'une usine d'ingénierie et de fabrication à Taïwan ; une équipe rassemblant plus de 400 ingénieurs issus de NVIDIA, Google TPU, Broadcom, SK hynix, TSMC et de sociétés de trading quantitatif ; et l'objectif de construire une infrastructure d'inférence IA à l'échelle du gigawatt d'ici 2027.

Gavin Uberti, cofondateur et PDG d'Etched, a déclaré : « Nous avons reconnu très tôt que l'IA de pointe deviendrait l'une des technologies les plus importantes sur le plan économique de tous les temps, mais l'infrastructure nécessaire pour servir ces modèles de manière durable et économiquement viable n'existait tout simplement pas. »