fr.wedoany.com Rapport : Le 2 juillet, l'entreprise américaine d'intelligence artificielle Anthropic a lancé les travaux préliminaires pour sa propre puce IA et a entamé des discussions avec Samsung Electronics en Corée du Sud concernant une éventuelle collaboration de fabrication. Le processeur concerné en est encore au stade de la planification, et Anthropic n'a pas encore déterminé les fonctionnalités de la puce, son niveau de puissance de calcul, ni sa future méthode de déploiement dans des serveurs ou des grappes de serveurs.
Le point clé de ce projet réside dans son caractère « préliminaire ». Anthropic n'a pas encore finalisé la conception de la puce, ni ne la confie immédiatement à Samsung pour une production en série. L'entreprise évalue plutôt si la voie d'une puce conçue en interne peut soutenir les besoins de calcul à long terme de ses services d'IA comme Claude. La pression en matière de puissance de calcul pour les entreprises de grands modèles provient principalement de trois étapes : l'entraînement, le réglage fin et l'inférence. La demande d'inférence continue d'augmenter avec la croissance du nombre d'utilisateurs, les appels des clients entreprises et l'essor des applications multimodales. Si la puce est destinée à l'inférence, elle doit accorder une plus grande importance à l'efficacité énergétique, au coût, au traitement parallèle par lots et à l'efficacité de l'accès mémoire. Si elle est destinée à l'entraînement, elle doit gérer l'interconnexion multi-cartes, les performances de calcul matriciel, la mémoire à large bande passante, la communication en grappe et l'adaptation de la pile logicielle.
Anthropic a déjà contacté plusieurs entreprises de conception de puces, mais n'est pas encore entré dans une phase de conception détaillée. Cela signifie que les spécifications de la puce restent très incertaines, notamment si elle adoptera une architecture ASIC, si elle sera dédiée à l'inférence du modèle Claude, si elle prendra également en charge les tâches d'entraînement, si elle sera intégrée dans ses propres grappes de serveurs, ou si elle sera déployée via des partenaires cloud. Une puce IA n'est pas qu'un simple processeur ; il faut également déterminer simultanément le type de boîtier, la configuration de la mémoire HBM, l'interface hôte, la conception de la carte, le refroidissement du serveur, l'alimentation électrique, le réseau de la grappe et la chaîne d'outils du compilateur. Le rôle potentiel de Samsung Electronics dans ce type de discussions pourrait inclure la fonderie de plaquettes, l'encapsulation avancée, la coordination de la mémoire et les services de fabrication de puces. Les processeurs IA dépendent de plus en plus de la mémoire à large bande passante et de l'encapsulation avancée ; la puce de calcul elle-même, la HBM, la structure d'interconnexion et la conception du refroidissement doivent être envisagées de manière unifiée. Pour Samsung, participer au projet de puce conçue en interne par Anthropic ne signifie pas seulement acquérir un client IA, mais aussi entrer dans un maillon clé de la chaîne d'approvisionnement en puissance de calcul construite par les entreprises américaines de grands modèles.
Les entreprises américaines de grands modèles tentent de réduire leur dépendance totale à l'égard de l'approvisionnement en GPU universels. Les GPU de Nvidia restent le choix dominant pour l'entraînement et l'inférence de l'IA, mais leur prix, leur cycle d'approvisionnement, leur consommation d'énergie et le coût de déploiement en grappe exercent une pression sur les entreprises d'IA. Une puce conçue en interne ne remplacera pas nécessairement complètement les GPU ; elle pourrait d'abord être utilisée pour des modèles spécifiques, des charges d'inférence particulières ou des grappes cloud internes, afin de réduire le coût unitaire de l'inférence dans des scénarios contrôlés. Si Anthropic poursuit ce projet, il devra lier la structure du modèle, les caractéristiques des opérateurs, la latence d'inférence, les besoins de débit et la conception matérielle ; sinon, même si la puce est fabriquée, il pourrait être difficile d'obtenir un avantage d'efficacité suffisant dans les services réels. Cette information replace également Samsung dans la compétition pour la fonderie de puces IA. TSMC occupe depuis longtemps une position dominante dans la fabrication de puces IA haut de gamme, tandis que Samsung espère attirer davantage de clients IA grâce à ses procédés avancés, sa HBM et ses capacités d'encapsulation. Auparavant, d'autres entreprises technologiques américaines avaient exploré des collaborations de fabrication de puces IA avec Samsung. L'ajout d'Anthropic à la liste des discussions montre que les entreprises de grands modèles et les fournisseurs de services cloud recherchent des voies d'approvisionnement en puces plus diversifiées. Pour l'ensemble de la chaîne d'infrastructure IA, la compétition en matière de puissance de calcul s'étend de « l'achat de GPU » à une compétition intégrée incluant la conception de puces, la fonderie, l'encapsulation, la mémoire, les serveurs et le déploiement dans les centres de données.
Actuellement, la puce IA conçue en interne par Anthropic n'est pas encore entrée dans une phase de produit claire. Les informations disponibles indiquent seulement que l'entreprise a lancé des travaux préliminaires, contacté des entreprises de conception de puces et discuté d'une éventuelle collaboration de fabrication avec Samsung. Que la puce soit réellement lancée en tant que projet, comment ses spécifications seront déterminées, qui participera à sa conception, quelle génération de procédé sera utilisée, et si elle sera déployée dans des grappes de serveurs, tout cela n'a pas encore de résultat final. La valeur de ces projets de puces à un stade précoce réside dans le fait qu'ils révèlent la réévaluation par les entreprises de grands modèles des coûts de calcul à long terme et de la sécurité de l'approvisionnement.










