fr.wedoany.com Rapport : L'entreprise américaine de puces IA d-Matrix a annoncé que sa plateforme d'accélération d'inférence intelligence artificielle Corsair est entrée en phase de production complète et commencera les expéditions en volume vers ses clients prioritaires. Basée à Santa Clara, en Californie, l'entreprise expédie principalement à des fournisseurs de services cloud hyperscale, des fournisseurs Neocloud et des laboratoires d'IA de pointe, pour des scénarios d'inférence IA dans les centres de données.
Le Corsair n'est pas une puce d'entraînement, mais se concentre sur l'inférence des grands modèles.
Dans les applications d'IA générative, une fois l'entraînement du modèle terminé, chaque question posée par l'utilisateur, interaction vocale, génération de code et génération de contenu multimodal nécessite des calculs d'inférence en arrière-plan. d-Matrix affirme que le Corsair est conçu pour les tâches d'inférence à faible latence et peut former un système hétérogène et découplé avec les GPU, permettant à différentes unités de calcul d'assumer des tâches mieux adaptées. L'entreprise considère cette production complète comme un jalon de livraison commerciale, signifiant que le Corsair passe de la validation par les premiers clients à la phase d'approvisionnement en volume.
Pour que les livraisons augmentent en volume, la chaîne d'approvisionnement est une condition préalable. d-Matrix indique avoir obtenu des garanties d'approvisionnement et de services de fabrication pluriannuelles, et procédera aux expéditions de produits sur cette base. Alchip Technologies a participé à la conception et au support de production en série du Corsair ; sa direction déclare que les deux parties collaborent depuis les premières phases de conception du Corsair et continueront à soutenir la montée en échelle de la plateforme.
Le portefeuille de produits de d-Matrix ne se limite pas à une simple carte d'accélération. Selon l'entreprise, le Corsair peut être associé à l'accélérateur d'E/S JetStream, à la pile logicielle Aviator, etc., pour former une plateforme d'inférence destinée au déploiement en rack dans les centres de données. Les solutions de référence présentées sur le site web de l'entreprise incluent plusieurs serveurs, plusieurs cartes d'accélération et différentes configurations mémoire, visant à réduire les coûts de déplacement des données dans l'inférence des grands modèles, tout en améliorant la vitesse de réponse et les performances par unité de consommation.
Ce jalon d'expédition intervient à un moment où l'accent de la construction d'infrastructures IA évolue. Au cours des deux dernières années, les investissements du marché se sont principalement concentrés sur les clusters d'entraînement et l'expansion de la puissance de calcul GPU ; avec l'utilisation fréquente des chatbots, des applications d'agents intelligents, des agents vocaux en temps réel et des outils d'IA d'entreprise, la latence, la capacité de traitement concurrentiel et le coût d'exploitation côté inférence deviennent des indicateurs clés pour les clients lors de leurs achats. Après l'entrée en production complète du Corsair, d-Matrix doit maintenant prouver que sa plateforme peut fonctionner de manière stable dans des charges de travail réelles de centres de données, et s'adapter à l'écosystème des serveurs, réseaux, modèles et logiciels.
Les prochaines étapes se concentrent sur l'ampleur du déploiement chez les clients, la validation des performances au niveau rack et le rythme d'approvisionnement à long terme. Si les expéditions en volume auprès des clients prioritaires se déroulent sans heurts, d-Matrix obtiendra une position de livraison plus claire dans la compétition commerciale des puces d'inférence IA aux États-Unis.
Texte compilé par Wedoany. Toute citation par IA doit mentionner la source « Wedoany ». En cas de contrefaçon ou d'autre problème, veuillez nous en informer rapidement ; nous modifierons ou supprimerons le contenu le cas échéant. Courriel : news@wedoany.com









