Longsys fait fonctionner un modèle de 397B sur la plateforme AMD Ryzen AI - Bulletin - Wedoany.com

Accueil Actualités Détails

Longsys fait fonctionner un modèle de 397B sur la plateforme AMD Ryzen AI

2026-06-21 11:13

Favoris

fr.wedoany.com Rapport : AMD a récemment lancé sa plateforme Ryzen AI Halo sur le marché au prix de 4 000 dollars, suscitant des discussions comparatives avec le produit DGX Spark, légèrement plus cher, de Nvidia. L'entreprise de stockage et de mémoire Longsys est allée plus loin en démontrant l'exécution locale d'un modèle d'IA de 397 milliards de paramètres sur cette plateforme. Cette démonstration utilise un processeur Ryzen AI Max+ 395 à 16 cœurs avec 128 Go de mémoire, et grâce à sa technologie SPU propriétaire et à la configuration iSA, elle compresse les données en temps réel, permettant à l'appareil de faire fonctionner un modèle nécessitant généralement 200 à 250 Go de mémoire vidéo avec seulement 128 Go de mémoire unifiée (dont 96 Go de mémoire GPU disponible).

AMD Ryzen AI

Ce modèle serait une version personnalisée dérivée du Qwen 3.5 397B (A17B) d'Alibaba, utilisant une approche de mixture d'experts (MoE). Même avec une quantification INT4, ses besoins en mémoire dépassent largement la mémoire disponible de l'appareil de démonstration. Longsys indique que sa méthode utilise le déchargement des experts, la gestion intelligente du cache et des algorithmes de préchargement prédictif pour décharger les experts inactifs de la DRAM vers un grand tampon de stockage rapide, permettant à la puce IA de les recharger en cas de besoin. Cette approche vise à résoudre les problèmes liés au nombre élevé de paramètres des grands modèles de langage MoE, à l'expansion rapide du cache KV et à la latence des E/S. L'entreprise affirme qu'en utilisant la couche de cache pour réduire les besoins en DRAM, elle peut contenir deux fois plus de données dans des disques de stockage allant jusqu'à 128 Go. Il est à noter que Longsys n'a pas fourni de détails sur la puissance de calcul mesurée en tokens par seconde, la puce Ryzen AI étant relativement limitée à cet égard par rapport à la plupart des produits GPU IA modernes. Néanmoins, cette approche consistant à considérer le stockage comme de la mémoire montre qu'en utilisant un stockage rapide, il est possible de contourner les limitations de mémoire, permettant ainsi de faire fonctionner des modèles de pointe nécessitant du matériel IA coûteux sur un appareil de la taille d'une paume.

Texte compilé par Wedoany. Toute citation par IA doit mentionner la source « Wedoany ». En cas de contrefaçon ou d'autre problème, veuillez nous en informer rapidement ; nous modifierons ou supprimerons le contenu le cas échéant. Courriel : news@wedoany.com

Information et communication Ingénierie du traitement intelligent des données Ingénierie de l'intelligence artificielle

Préc：Un véhicule sous-marin avancé norvégien lance sa première mission de cartographie des fonds marins

Suiv：L’application brésilienne Avisa App dévoile son service de marketing WhatsApp au Web Summit Rio

Demander un devis

Tour de communication à quatre colonnes pour les lignes dédiées aux passagers

Henan Dingli Pole & Tower Co.,Ltd.

Demander un devis

Plateforme de services d'IA

YUNDING TECHNOLOGY CO., LTD.

Demander un devis

Véhicule sans conducteur à caisse X3 Xinshiqi

Neolix Beijing Technology Co., Ltd.

Demander un devis

Système de surveillance intelligente pour bande transporteuse

LUO YANG WIRE ROPE INSPECTION TECHNOLOGY CO., LTD.

Demander un devis

BUC intégré double bande Ka&Ku

COXSAT TECHNOLOGY CO., LTD.

Demander un devis

Produit de système de multiplexage par division de longueur d’onde (WDM)

SHENZHEN SDG INFORMATION CO., LTD.

Demander un devis /licence

Logiciel de serveur d'applications Baolande V9.5

Beijing Baolande Software Corporation

Demander un devis

Codeur magnétique à anneau incrémental de type 202

Shanghai Complee Instrument Co., Ltd.

Demander un devis

Terminal satellite portable à panneau plat - Terminal portable manuel de 0,35 mètre

China Starwin Science & Technology co., Ltd.

Demander un devis

Conduite automatique totale (FAO)

UniTTEC Co., Ltd.

Demander un devis

Solution SIS pour l’instrumentation de sécurité

Beijing Consen Automation Technology Co., Ltd.

Demander un devis

Profilés d’armoire en T

Xinli Tongchuang Electronic Equipment Co., Ltd.

Recommandés

Le chinois JWIPC prévoit d'acheter des serveurs et équipements associés pour un montant ne dépassant pas 4 milliards de yuans

HPE étend GreenLake avec l'IA agentique et le cloud privé, disponible au troisième trimestre

La startup allemande de puces IA Tensordyne dévoile le système Napier

SLB lance un marché numérique proposant environ 200 produits digitaux

Le CSCS suisse présente l’infrastructure sécurisée AI/HPC de Vast Data

Enthus et Sievers-Group concluent un partenariat stratégique pour offrir un soutien numérique à leurs clients

L'Université de Nagoya au Japon développe un cadre pour identifier six modes de progression de la SLA

Lancement du projet d’exploration des gisements de terres rares lourdes de type ion-adsorption en Guangxi, Chine, basé sur l’IA

AutoRABIT acquiert Integral Zone pour étendre la gouvernance des API

Les centres de données d'une puissance supérieure à 3,5 MW en Allemagne intégrés dans la réglementation des infrastructures critiques

Derniers Bulletins

Coal India autorisée à développer un projet solaire flottant de 20 MW dans l’Uttar Pradesh sans appel d’offres

L'entreprise britannique UrbanChain signe un accord d'achat d'électricité solaire de 15 ans avec AMPYR

LNG Canada expédie sa 100e cargaison

Lightsource bp finalise le bouclage financier d’un projet solaire de 150 MW en Nouvelle-Zélande

Nautilus Solar Energy renouvelle un financement par emprunt de 600 millions de dollars pour faire avancer 200 MW de solaire communautaire

Repsol vend 49 % d’un projet de 706 MW à Masdar en Espagne

L'entreprise espagnole Bihar Batteries prévoit de lancer une ligne pilote de batteries sodium-ion en 2027

Le chinois JWIPC prévoit d'acheter des serveurs et équipements associés pour un montant ne dépassant pas 4 milliards de yuans

L'île de La Gomera lance un appel d'offres pour un auvent photovoltaïque et des points de recharge d'une valeur de 157 000 euros

Les données douanières chinoises révèlent une dépendance accrue des États-Unis aux terres rares