Intel s’associe à SambaNova et Foxconn pour lancer une architecture d’IA d’inférence au niveau rack

2026-06-03 09:43

Favoris

fr.wedoany.com Rapport : Intel s’est associé à SambaNova et Foxconn pour dévoiler, lors du salon Computex 2026 à Taipei, une architecture au niveau rack spécialement conçue pour les charges de travail d’inférence et d’IA agentique. Cette plateforme intègre les processeurs Intel Xeon, les unités de flux de données reconfigurables (RDU) SN-50 de SambaNova et les capacités d’intégration système de Foxconn, offrant des racks d’IA prêts pour la production destinés aux centres de données hyperscale, aux entreprises et aux usines d’IA émergentes. Cette initiative montre qu’Intel positionne les CPU comme composants centraux des déploiements d’IA à grande échelle, répondant à la tendance du marché où les besoins en inférence dépassent ceux de l’entraînement des modèles.

Cette architecture reflète l’évolution de l’industrie d’une infrastructure centrée sur l’entraînement vers une infrastructure centrée sur l’inférence. Dans les scénarios d’entraînement, un CPU supporte généralement quatre GPU, mais avec l’expansion des charges de travail agentiques, le rapport CPU/accélérateur tend vers 1:1. La conception du rack privilégie les performances par watt et par dollar plutôt que la maximisation du débit d’entraînement. Intel souligne que l’IA agentique impose des exigences accrues en matière d’orchestration, d’ordonnancement, de gestion de la mémoire, de déplacement des données et d’exécution des charges de travail non matricielles par le CPU.

Intel a présenté une architecture d’inférence entièrement découplée via Vector Core Compute, une plateforme soutenue par Vista Equity Partners et Cambium Capital, positionnée comme un cloud d’inférence dédié pour les entreprises. Lors d’une démonstration exécutant le modèle MiniMax 2.5, la charge de travail a été dynamiquement répartie entre différentes architectures silicium pour optimiser chaque étape du pipeline d’IA : l’orchestration et l’exécution étaient assurées par le processeur Intel Xeon 6, le traitement du décodage par le SambaNova SN40 RDU, et les opérations de préremplissage par le GPU NVIDIA Blackwell. Ce déploiement est considéré comme l’un des premiers pipelines d’inférence en production à répartir la charge de travail entre différents types de processeurs. Together.ai a déjà signé en tant que premier client commercial.

Les éléments clés de l’annonce incluent : la collaboration entre Intel, SambaNova et Foxconn pour fournir une infrastructure au niveau rack destinée aux déploiements d’inférence et d’IA agentique ; Foxconn assurant l’intégration système de bout en bout, la fabrication et le déploiement, avec des variantes CPU haute densité prévues pour optimiser les coûts d’inférence, de traitement de données et d’IA hybride ; Intel lançant le processeur Xeon 6+ (nom de code Clearwater Forest), basé sur le nœud de procédé Intel 18A, déployé pour la première fois dans un centre de données. Un seul rack refroidi par liquide peut supporter jusqu’à 36 864 cœurs Xeon 6+, conçu pour maximiser le parallélisme des agents d’IA dans une enveloppe de puissance d’environ 100 kW.

Lip-Bu Tan, PDG d’Intel, a déclaré qu’avec l’essor de l’inférence, de l’IA agentique et de l’IA physique, Intel s’engage à innover du niveau de la puce à celui du système. L’accent de cette annonce est mis sur la tentative d’Intel de définir une architecture de rack d’IA complète. NVIDIA s’est déjà étendu à une infrastructure d’IA complète via DGX, NVL72 et les conceptions d’usines d’IA ; Intel adopte une stratégie similaire en positionnant Xeon comme la couche d’orchestration de l’inférence d’IA, tout en collaborant avec des fournisseurs d’accélérateurs spécialisés. Le partenariat avec SambaNova permet à Intel d’accéder à une architecture d’accélérateur d’inférence mature sans attendre le développement d’une alternative interne. Dans un contexte où les dépenses passent de l’entraînement au déploiement d’IA en production, la consommation électrique, l’utilisation, la latence et le coût total de possession deviennent des indicateurs clés. L’accent mis par Intel sur la densité des CPU, l’intégration au niveau rack et l’inférence découplée vise à saisir les opportunités du marché des usines d’IA qui n’ont pas besoin de nombreux GPU d’entraînement mais nécessitent des capacités d’orchestration et d’inférence à grande échelle.

Texte compilé par Wedoany. Toute citation par IA doit mentionner la source « Wedoany ». En cas de contrefaçon ou d'autre problème, veuillez nous en informer rapidement ; nous modifierons ou supprimerons le contenu le cas échéant. Courriel : news@wedoany.com

Chine

États-Unis

Ce texte est rédigé, traduit et republié à partir des informations de l'Internet mondial et de partenaires stratégiques, uniquement pour la communication entre lecteurs. En cas d'infraction au droit d'auteur ou d'autres problèmes, veuillez nous en informer à temps pour la modification ou la suppression. La reproduction de cet article est strictement interdite sans autorisation formelle. Mail : news@wedoany.com

Préc：L'Ofcom britannique examine la tarification du FTTP et de l'Ethernet d'Openreach, avec une mise en œuvre prévue pour octobre 2026

Suiv：Le PDG de Cisco prévoit un triplement du trafic réseau lié à l’IA dans les trois prochaines années