Groq, une entreprise américaine, lève 650 millions de dollars pour étendre son cloud d'inférence IA à 200 mégawatts

2026-06-24 08:47

Favoris

fr.wedoany.com Rapport : Le 22 juin, la société américaine de puces d'inférence IA Groq a annoncé avoir bouclé un nouveau tour de financement de croissance de 650 millions de dollars. Ce tour, mené par Disruptive et Infinitum, avec la participation continue de certains investisseurs existants, servira à accélérer l'expansion de l'infrastructure cloud d'inférence IA de Groq.

L'activité principale de Groq s'est désormais tournée vers les services cloud d'inférence IA à grande échelle. L'entreprise exploite actuellement 13 centres de données en Amérique du Nord, en Europe, au Moyen-Orient et en Asie-Pacifique, servant plus de 5 millions de développeurs et des milliers d'entreprises natives de l'IA, traitant des billions de jetons chaque semaine. Les nouveaux fonds serviront à moderniser l'infrastructure existante des centres de données et à déployer les dernières technologies d'inférence de Groq, y compris le système NVIDIA LPX.

Selon les plans de l'entreprise, Groq étendra la capacité totale installée de son cloud d'inférence IA à 200 mégawatts d'ici la fin 2027. Cet objectif répond à la croissance rapide de la demande de puissance de calcul côté inférence. Alors que les applications d'IA passent de la phase d'entraînement et de validation expérimentale à la phase de déploiement en production, la demande des entreprises pour une puissance de calcul d'inférence à faible latence, haute concurrence et coût maîtrisé augmente, et le cloud d'inférence passe d'un service auxiliaire à un élément clé de l'infrastructure IA.

Le fondement technologique de Groq est l'architecture de processeur d'inférence LPU, principalement optimisée pour les tâches de calcul séquentiel comme les grands modèles de langage. Contrairement à la phase d'entraînement, les services d'inférence mettent davantage l'accent sur le fonctionnement continu, la vitesse de réponse, le coût unitaire, la stabilité du service et la capacité de planification à grande échelle. Après ce financement, Groq continue d'étendre sa plateforme cloud, indiquant que son centre d'intérêt commercial passe de la simple démonstration de capacité de puce à la fourniture durable de services cloud d'inférence.

L'équipe de direction a également été réorganisée. Alan Rice a rejoint Groq en tant que directeur de l'exploitation, ayant précédemment occupé des postes liés aux centres de données chez xAI et Meta, avec une expérience dans l'exploitation d'infrastructures à grande échelle. Sinclair Schuller et Rakesh Malhotra deviendront respectivement directeur technique et directeur des produits à partir de juillet, chargés de piloter le développement de la plateforme technologique et des produits destinés aux entreprises.

Ce financement intervient après que Groq a conclu un accord de licence technologique non exclusif avec NVIDIA. Groq a indiqué que la prochaine plateforme LPX de NVIDIA intègre déjà la technologie d'inférence de Groq. Pour Groq, la progression parallèle des licences technologiques et de l'expansion du cloud lui permet de ne plus dépendre uniquement de la vente de ses propres puces, mais de soutenir sa croissance grâce à la plateforme cloud d'inférence, aux licences technologiques et à la capacité d'exploitation des centres de données.

Le marché de la puissance de calcul IA passe de « qui peut entraîner le plus grand modèle » à « qui peut faire fonctionner les modèles de manière stable au coût le plus bas ». L'entraînement détermine la limite supérieure des capacités du modèle, tandis que l'inférence détermine si l'application peut être déployée à grande échelle. En investissant les fonds levés dans des centres de données mondiaux et une expansion du cloud d'inférence à 200 mégawatts, Groq reflète le fait que la concurrence dans l'infrastructure IA entre dans une phase d'exploitation continue.

La pression qui pèse sur Groq est également claire : l'objectif de 200 mégawatts nécessite une adéquation simultanée de l'électricité, des salles informatiques, du refroidissement liquide, du réseau, de l'approvisionnement en puces et de la charge client. La capacité du cloud d'inférence à générer des revenus à long terme ne dépend pas seulement de l'échelle de la puissance de calcul, mais aussi de la compétitivité des prix, de l'écosystème des modèles, de la fidélisation des clients entreprises et de la stabilité du service. Pour les entreprises d'applications d'IA, ce qui a vraiment de la valeur n'est pas la puissance de calcul de pointe, mais la capacité d'inférence qui peut être utilisée à long terme, de manière stable et à faible coût.

Texte compilé par Wedoany. Toute citation par IA doit mentionner la source « Wedoany ». En cas de contrefaçon ou d'autre problème, veuillez nous en informer rapidement ; nous modifierons ou supprimerons le contenu le cas échéant. Courriel : news@wedoany.com