fr.wedoany.com Rapport : Alors que le centre de gravité du marché des infrastructures IA passe de l’entraînement à grande échelle à l’inférence, les entreprises sud-coréennes de semi-conducteurs IA accélèrent leur expansion en s’appuyant sur des architectures uniques et des cas concrets, cherchant à identifier les points faibles de Nvidia sur le marché mondial des infrastructures de nouvelle génération.
Les principales entreprises qui mènent le camp des semi-conducteurs IA en Corée du Sud incluent Rebellions, Mobilint et HyperAccel, chacune rivalisant sur la base de marchés cibles et de trajectoires technologiques différents. Rebellions s’est imposée grâce à la production en série de puces hautes performances et à une commercialisation à grande échelle. Son produit phare de nouvelle génération, le « REBEL100 », adopte une architecture Chiplet avancée reliant quatre puces et intègre la mémoire HBM3E de cinquième génération, offrant des performances de calcul élevées comparables aux GPU phares actuels tout en garantissant une excellente efficacité énergétique. Rebellions a déjà déployé son NPU dans le service de résumé d’appels « A. » de SK Telecom, qui génère jusqu’à 50 millions d’appels API par jour. Actuellement, avec un trafic d’inférence moyen de 20 millions par mois et 700 000 par jour, le NPU de Rebellions a remplacé les GPU existants et traite les données de manière stable. De plus, son produit est utilisé dans le service d’aide au diagnostic IA pour animaux de compagnie « Excalibur », déployé dans plus de 1 000 cliniques vétérinaires à travers le pays.

Mobilint cible depuis le début le marché de l’inférence, à la fois pour les centres de données et les dispositifs terminaux, en concevant des NPU à haute performance et faible consommation. Son produit phare, « ARIES », offre une puissance de calcul allant jusqu’à 80 TOPS avec une consommation d’énergie d’environ 25 W. Mobilint collabore avec l’entreprise de centres de contact IA MetaM pour exploiter une plateforme de conseil IA basée sur NPU, et avec des entreprises d’IA industrielle comme POSCO DX pour construire et valider des infrastructures IA adaptées aux environnements de fabrication. Elle a également fourni l’IA autonome « MLX-A1 » à l’Université Yonsei. Récemment, Mobilint a achevé avec succès le « Projet de démonstration et de diffusion de services IA en périphérie » soutenu par le Ministère des Sciences et des TIC (MSIT), en intégrant ses NPU « ARIES » et « REGULUS » dans des dispositifs périphériques tels que des caméras de surveillance forestière et des drones, construisant une infrastructure de gestion des catastrophes capable de détecter les incendies en temps réel et de prédire leur propagation via des cartes 3D. Mobilint prévoit de lancer au second semestre de cette année le premier SoC IA autonome « REGULUS » parmi les entreprises coréennes de NPU.
HyperAccel a conçu dès sa création le « LPU (LLM Processing Unit) » spécifiquement pour les charges de travail d’inférence des IA génératives et des LLM, en utilisant une mémoire LPDDR5x relativement économique et économe en énergie tout en maximisant l’utilisation de la bande passante, offrant ainsi des avantages en termes de latence, d’efficacité énergétique et de coût total de possession (TCO). HyperAccel, avec le serveur « Orion » comme point de départ, développe une feuille de route de produits pour les centres de données et l’informatique en périphérie. Elle collabore avec Naver Cloud pour construire des infrastructures d’inférence IA optimisées pour les centres de données, et avec LG Electronics pour appliquer la technologie d’inférence à divers environnements de dispositifs. En partenariat avec des acteurs mondiaux clés tels que Samsung Electronics, SemiFive, Advantech, INVENTEC et HPE, elle démontre à la fois sa compétitivité technologique et l’évolutivité de sa commercialisation.

Ces trois entreprises ont toutes saisi le changement d’époque où l’infrastructure passe de l’entraînement à l’inférence et aux agents IA, en concevant des architectures efficaces pour les charges de travail d’inférence afin de maximiser la valeur du TCO. Pour briser les barrières matérielles et logicielles centrées sur Nvidia, elles ont toutes adopté pleinement l’écosystème open source, en soutenant activement leurs propres piles logicielles ou SDK, permettant aux développeurs d’utiliser directement des frameworks tels que PyTorch, Hugging Face, vLLM et Triton, sans nécessiter de portage complexe ou de modification de code. Les trois entreprises s’efforcent d’accumuler des cas de référence concrets et d’établir des alliances mondiales, en s’appuyant sur des exemples comme le service de résumé d’appels à grande échelle, le conseil IA et le développement conjoint avec Naver Cloud, pour commencer leur expansion à l’échelle mondiale.
Avec le déplacement du centre de gravité du marché des infrastructures IA vers l’inférence, les services cloud NPU nationaux (NPUaaS) combinant rapport qualité-prix et souveraineté technologique attirent l’attention. Plus de 55 % des dépenses mondiales en infrastructures IA sont consacrées à l’inférence, et 80 à 90 % du coût total du cycle de vie provient des coûts d’inférence, ce qui accroît la demande d’alternatives aux GPU coûteux. Gabia a officiellement lancé en avril dernier un NPUaaS équipé du « ATOM-Max » de Rebellions, dont la vitesse de traitement lors du concours mondial d’évaluation des performances IA « MLPerf » est 1,5 à 3 fois supérieure à celle des GPU de même niveau, avec une efficacité énergétique améliorée de 3 à 4,5 fois. KT Cloud a officiellement lancé un produit « Serveur NPU » conforme aux réglementations de sécurité pour les institutions publiques et les fournisseurs de solutions d’agents IA publics, avec environ 300 accélérateurs NPU déjà en service. Elle prévoit d’ajouter la prochaine puce de Rebellions, « REBEL100 », après son lancement en volume au troisième trimestre de cette année. Samsung SDS prévoit de lancer un NPUaaS basé sur le deuxième NPU de FuriosaAI, « RNGD », en intégrant directement le serveur RNGD à la couche de virtualisation de la plateforme cloud Samsung (SCP) via une technologie de virtualisation matérielle.
Les fournisseurs de services cloud (CSP) s’accordent à dire que l’infrastructure IA future entrera dans un environnement de calcul hétérogène mêlant GPU, NPU et TPU, et que le « cloud souverain », visant à préserver la souveraineté des données, constitue un signal positif pour les NPU nationaux. Pour que les NPU offrent une expérience développeur équivalente à celle du « CUDA » de Nvidia, le soutien actuel du projet K-Cloud du gouvernement et les investissements logiciels des fabricants de semi-conducteurs doivent se compléter mutuellement. Un acteur du secteur a souligné que le rôle des CSP, en tant que transmetteurs finaux de la valeur technologique des semi-conducteurs IA nationaux sur le terrain, évolue vers l’intégration de la conception de services, du conseil en optimisation d’inférence, de l’automatisation des plateformes et de la surveillance de la sécurité.









