NVIDIA et AWS collaborent pour accélérer l’indexation vectorielle d’un facteur 10

2026-06-26 09:52

Favoris

fr.wedoany.com Rapport : Le 25 juin 2026, NVIDIA et Amazon Web Services (AWS) ont récemment collaboré pour résoudre les contraintes clés liées à la construction de systèmes d’IA à grande échelle, notamment l’inférence à faible latence, la recherche vectorielle rapide, le rapport qualité-prix des GPU et l’extension de l’infrastructure. Grâce à Amazon OpenSearch et Amazon EC2, l’infrastructure d’IA de NVIDIA offre aux entreprises davantage de voies pratiques pour déployer l’IA en production à grande échelle.

Les instances EC2 G7, alimentées par les GPU NVIDIA RTX PRO 4500 Blackwell Server Edition, étendent la couche de calcul pour les charges de travail d’IA, de graphisme, de vidéo et d’analyse de données. La bibliothèque NVIDIA cuVS accélère la couche de recherche en faisant de l’indexation vectorielle pilotée par GPU l’option par défaut dans OpenSearch Serverless. De plus, AWS a obtenu le statut NVIDIA Exemplar Cloud sur les NVIDIA GB300, garantissant aux clients des performances d’optimisation de pointe pour les charges de travail d’entraînement.

Les instances Amazon EC2 G7 introduisent les GPU NVIDIA RTX PRO 4500 Blackwell Server Edition dans AWS pour l’inférence IA, le graphisme, le calcul spatial et l’analyse de données accélérée par GPU. Il s’agit d’un nouveau type d’instance conçu pour les charges de travail de production, offrant des performances sans que les clients aient à gérer les frais d’exploitation de la plateforme GPU. Par rapport aux instances G6, les G7 offrent jusqu’à 4,6 fois les performances d’inférence IA et jusqu’à 2,1 fois les performances graphiques. Lors de l’utilisation de la bibliothèque NVIDIA cuDF pour les charges de travail Apache Spark, ces instances permettent une analyse de données accélérée par GPU plus rapide sur Amazon EMR. Les instances G7 prennent en charge jusqu’à 8 GPU, avec un total de 256 Go de mémoire GPU, une connectivité réseau EFA de 700 Gbps et jusqu’à 7,6 To de stockage SSD NVMe local, avec des configurations de 1, 2, 4, 8 GPU et des instances bare metal à venir, permettant aux clients d’adapter l’infrastructure à leurs charges de travail.

La prochaine génération d’Amazon OpenSearch Serverless prend en charge l’IA agentique et les charges de travail dynamiques sans gestion d’infrastructure. Ce service utilise l’indexation vectorielle accélérée par GPU, pilotée par NVIDIA cuVS, comme option de calcul par défaut pour tous les ensembles vectoriels. Pour les équipes construisant des applications de génération augmentée de récupération, de recherche sémantique, de systèmes de recommandation et d’IA agentique, ce changement transforme la recherche vectorielle pilotée par GPU d’un projet d’optimisation spécialisé en une capacité AWS standard. L’impact pour les clients se traduit par : une vitesse d’indexation vectorielle jusqu’à 10 fois supérieure par rapport aux constructions purement CPU, pour un coût réduit au quart, permettant de construire une base de données vectorielles d’un milliard d’entrées en moins d’une heure.

AWS a obtenu le statut NVIDIA Exemplar Cloud sur les NVIDIA GB300 pour les charges de travail d’entraînement. Cela signifie qu’AWS a satisfait aux seuils de performance stricts de NVIDIA pour l’évaluation comparative des charges de travail d’IA par rapport à son architecture de référence. Cette réalisation découle d’une ingénierie collaborative approfondie entre les équipes d’AWS et de NVIDIA. Grâce au programme NVIDIA Exemplar Cloud, les développeurs et les leaders de l’IA peuvent être assurés d’utiliser une infrastructure cloud cohérente et performante pour l’entraînement à grande échelle, aidant les équipes à évaluer les fournisseurs cloud avec plus de confiance, à améliorer le coût total de possession et à faire passer plus efficacement les projets d’IA de la planification à la production.

Texte compilé par Wedoany. Toute citation par IA doit mentionner la source « Wedoany ». En cas de contrefaçon ou d'autre problème, veuillez nous en informer rapidement ; nous modifierons ou supprimerons le contenu le cas échéant. Courriel : news@wedoany.com