Le centre HPC américano-japonais discute des défis des plateformes d’IA scientifique à TPC26
2026-06-11 09:41
Favoris

fr.wedoany.com Rapport : L’IA apporte une série de nouvelles exigences aux centres HPC. Les chercheurs ne se concentrent plus uniquement sur l’entraînement des modèles ; beaucoup commencent à rechercher des services d’inférence et des agents d’IA dans le cadre de leurs travaux quotidiens. Pour les centres HPC, cela signifie qu’il faut déterminer comment fournir ces services à grande échelle et les faire fonctionner en synergie avec l’infrastructure HPC existante.

Ces questions ont été au cœur de la session « Plateformes d’IA pour la science : inférence, agents et services d’IA dans les installations HPC » de la conférence TPC26. Les discussions ont réuni des intervenants de laboratoires nationaux, de centres de calcul intensif, de l’industrie et d’instituts de recherche, qui ont partagé leurs expériences dans la construction et l’exploitation de services d’IA pour les chercheurs. Parmi les participants figuraient le Dr İlkay Altıntaş, scientifique en chef des données au San Diego Supercomputer Center et chercheur principal du National Data Platform ; le Dr Venkat Vishwanath, responsable IA à l’Argonne Leadership Computing Facility ; le Dr Jason Haga du National Institute of Advanced Industrial Science and Technology (AIST) du Japon ; Samantha Sury de HPE ; le Dr Paola Buitrago du Pittsburgh Supercomputing Center ; le Dr Shoaja Fan ; et le Dr Dan Stanzione, directeur exécutif du Texas Advanced Computing Center (TACC).

Le Dr Altıntaş a ouvert la discussion par un aperçu du National Research Platform, qui offre aux chercheurs un accès aux modèles d’IA via des services partagés. Selon le Dr Altıntaş, la plateforme doit être envisagée à trois niveaux distincts, dont la couche infrastructure, qui englobe le calcul, le stockage et tout ce qui les entoure, similaire aux services HPC, mais avec des jetons plutôt que des heures de cœur. Le National Research Platform propose actuellement neuf modèles ouverts, visant à permettre aux chercheurs d’accéder aux capacités de l’IA sans avoir à déployer et gérer leur propre infrastructure. Ce thème a été récurrent tout au long de la session, les intervenants discutant de la manière dont les centres HPC s’adaptent à la demande croissante de services d’inférence et d’outils d’IA.

La construction de ces services nécessite également une infrastructure spécialement conçue pour l’inférence. L’exposé du Dr Haga a principalement présenté les efforts du Japon pour évaluer une gamme d’accélérateurs d’IA et de technologies d’inférence dans le cadre de son programme national de bancs d’essai. Selon Haga, le programme prévoit d’évaluer divers accélérateurs d’IA de pointe et de développer des technologies pour fournir des services d’inférence performants ainsi que des méthodes d’accès pratique à ces différentes ressources de calcul. Pour les chercheurs, le matériel lui-même est souvent secondaire ; ce qui importe, c’est que le service soit disponible, performant et s’intègre à leur travail sans qu’ils aient à devenir des experts. Ce projet vise à aider les chercheurs à expérimenter différentes plateformes matérielles d’IA, à fournir un cadre pour déployer des services d’inférence et à étudier comment un portefeuille plus large d’accélérateurs peut soutenir les futures charges de travail d’IA scientifique.

Les exposés ont souligné le défi auquel sont confrontées les installations HPC : les chercheurs ne se soucient pas du matériel sous-jacent, mais s’attendent de plus en plus à ce que les services d’IA soient disponibles à la demande.

Bien que les discussions aient principalement porté sur l’infrastructure et la technologie, le Dr Stanzione a estimé que les questions économiques pourraient finalement constituer un défi plus grand. Stanzione a souligné que les jetons coûtent en réalité de l’argent, et que lorsque les gens les utilisent massivement, de nombreux laboratoires ont envisagé d’abandonner leur utilisation au cours des derniers mois. À mesure que les services d’IA deviennent plus largement disponibles, leur utilisation augmente rapidement, ce qui génère une série de pressions différentes de celles des charges de travail HPC traditionnelles, en particulier lorsque les institutions tentent d’équilibrer une demande croissante avec des budgets limités. Selon Stanzione, le défi à long terme pourrait ne pas être de construire des plateformes d’inférence, mais de trouver des moyens durables de les exploiter. Il a indiqué que, parmi les nombreux problèmes techniques, l’aspect financier pourrait, à long terme, dicter les actions plus que tout autre facteur.

Les discussions ont montré comment les installations HPC s’adaptent à la prochaine phase des applications d’IA. Bien que la majeure partie de l’attention de l’industrie reste concentrée sur les modèles et le matériel, les intervenants sont revenus à plusieurs reprises sur la réalité pratique et inévitable de la fourniture de l’IA en tant que service. Des plateformes d’inférence partagées et des bancs d’essai d’accélérateurs à l’économie de la consommation de jetons, les défis abordés dans les exposés indiquent que l’avenir de l’IA scientifique pourrait dépendre tout autant de l’exploitation et de l’infrastructure que des progrès des modèles eux-mêmes.

Texte compilé par Wedoany. Toute citation par IA doit mentionner la source « Wedoany ». En cas de contrefaçon ou d'autre problème, veuillez nous en informer rapidement ; nous modifierons ou supprimerons le contenu le cas échéant. Courriel : news@wedoany.com