Intel annonce la puce « Crescent Island » pour 2026, avec 480 Go de mémoire

2026-06-02 09:37

Favoris

fr.wedoany.com Rapport : Le 1er juin, Intel a dévoilé lors des annonces liées au COMPUTEX 2026 de nouveaux détails sur son GPU de nouvelle génération pour centres de données, Crescent Island, qui peut être traduit en chinois par « Nouvelle Lune ». Cette puce, destinée aux charges de travail d’inférence IA, peut être configurée avec jusqu’à 480 Go de mémoire LPDDR5x, adopte une conception PCIe refroidie par air de 350 W, et devrait entrer en phase d’échantillonnage client ou de développement produit avancé au second semestre 2026.

Le point différenciateur clé de Crescent Island est d’éviter la voie unique coûteuse de la mémoire HBM et du refroidissement liquide dans la concurrence des puces d’inférence IA. Les accélérateurs IA haut de gamme de NVIDIA, AMD et autres sont généralement centrés sur la mémoire à haute bande passante, l’encapsulation avancée et les systèmes de refroidissement liquide à haute densité, adaptés à l’entraînement à grande échelle et aux clusters d’inférence haute performance, mais entraînant également des coûts de construction de centres de données plus élevés, des pressions d’approvisionnement et des barrières d’exploitation et de maintenance. Intel met cette fois l’accent sur la grande capacité mémoire LPDDR5x, le facteur de forme PCIe refroidi par air de 350 W et un coût total de possession plus faible, ciblant clairement un autre type de besoin client : les entreprises et les fournisseurs de services cloud doivent exécuter de plus en plus d’inférences de grands modèles, de tâches à long contexte et d’applications d’agents, mais tous ne sont pas prêts à supporter les coûts d’achat et de déploiement des cartes d’entraînement haut de gamme. Pour les applications nécessitant le traitement d’un grand nombre de tokens, de contextes documentaires et de tâches multi-tours d’agents, la capacité mémoire devient une variable importante affectant l’expérience d’inférence et la structure des coûts. Une configuration de 480 Go de mémoire permet à davantage de poids de modèle, de caches de contexte et de données d’inférence de fonctionner à proximité de la puce.

Ce GPU pour centre de données est basé sur l’architecture Xe 3P. Intel indique que Crescent Island prendra en charge une gamme de types de données et de formats de micro-échelle, du FP4 natif et MXFP4 au FP64, visant à offrir une plus grande flexibilité entre différentes applications IA.

Du point de vue du positionnement produit, Crescent Island se rapproche davantage d’un accélérateur optimisé en termes de coûts pour les charges de travail d’inférence IA et d’agents, plutôt que d’un produit en concurrence directe avec les GPU d’entraînement haut de gamme. Les applications IA passent de requêtes-réponses uniques à l’exécution continue de tâches ; les modèles doivent lire de nombreux documents, appeler des outils externes, maintenir une mémoire contextuelle, effectuer la génération de code et la vérification des résultats, ce qui augmente les exigences en matière de capacité mémoire, de prise en charge des types de données et de stabilité de la pile logicielle lors de la phase d’inférence. Les conceptions de référence précédemment divulguées par Intel étaient basées sur 160 Go de mémoire LPDDR5X ; cette nouvelle divulgation d’une capacité maximale de 480 Go signifie qu’Intel tente de répondre aux besoins d’inférence à long contexte et à volume élevé de tokens avec un pool mémoire plus important. Si ce schéma peut démontrer de bonnes performances par watt et par dollar dans des déploiements réels, Crescent Island pourrait offrir aux centres de données IA d’entreprise une option complémentaire entre l’inférence CPU, l’inférence GPU traditionnelle et les accélérateurs IA haut de gamme.

Intel intègre également Crescent Island dans un écosystème logiciel et de calcul hétérogène plus ouvert. L’entreprise indique que sa pile logicielle IA est conçue pour les plateformes de calcul hétérogène, permettant aux développeurs de développer, valider et optimiser les charges de travail à l’avance sur du matériel tel que les GPU Arc Pro, puis de les migrer vers Crescent Island. Cette stratégie est particulièrement cruciale pour Intel, car la concurrence des accélérateurs IA ne dépend pas seulement des spécifications des puces, mais aussi de l’écosystème logiciel, de l’adaptation des modèles, des coûts de migration pour les développeurs et de la volonté de déploiement des fournisseurs de services cloud. L’écosystème CUDA de NVIDIA conserve toujours une barrière solide, et AMD continue de promouvoir l’écosystème ROCm. Si Intel souhaite que Crescent Island entre dans les centres de données IA réels, il doit permettre aux frameworks d’inférence, aux outils d’orchestration, aux services de modèles et aux applications d’entreprise de fonctionner à faible coût sur ses GPU.

Les variables ultérieures se concentrent sur le rythme d’échantillonnage client, les spécifications finales de production en série, la maturité de l’écosystème logiciel, les performances d’inférence réelles et les coûts de la chaîne d’approvisionnement. Si Crescent Island peut progresser comme prévu et démontrer un avantage en termes de coûts dans l’inférence à long contexte, les flux de travail d’agents et les déploiements IA d’entreprise, cela aidera Intel à rétablir une position différenciée sur le marché des centres de données IA ; si l’adaptation logicielle ou le rythme de livraison est insuffisant, l’attrait matériel des 480 Go de mémoire pourrait encore avoir du mal à se traduire en commandes à grande échelle.

Texte compilé par Wedoany. Toute citation par IA doit mentionner la source « Wedoany ». En cas de contrefaçon ou d'autre problème, veuillez nous en informer rapidement ; nous modifierons ou supprimerons le contenu le cas échéant. Courriel : news@wedoany.com

Chine

États-Unis

Ce texte est rédigé, traduit et republié à partir des informations de l'Internet mondial et de partenaires stratégiques, uniquement pour la communication entre lecteurs. En cas d'infraction au droit d'auteur ou d'autres problèmes, veuillez nous en informer à temps pour la modification ou la suppression. La reproduction de cet article est strictement interdite sans autorisation formelle. Mail : news@wedoany.com

Préc：L'NTCA américaine appelle à la publication des données de performance des réseaux financés par le BEAD

Suiv：NetBrain lance un agent IA pour diagnostiquer et réparer automatiquement les problèmes réseau