Sakana AI choisit Google Cloud comme infrastructure de base pour Sakana Fugu
2026-07-02 14:16
Favoris

fr.wedoany.com Rapport : La startup d’IA Sakana AI a choisi la plateforme Gemini Enterprise Agent Platform de Google Cloud comme infrastructure de base pour son système multi-agents Sakana Fugu. Google Cloud Japon a publié le 29 juin un article de cas détaillant la collaboration entre les deux parties.

Sakana Fugu est un système multi-agents qui sélectionne ou combine plusieurs modèles d’IA en fonction de la difficulté des tâches. Il comprend deux types : Fugu, axé sur la rapidité d’inférence, et Fugu Ultra, haute performance. Fugu Ultra revendique des performances supérieures à celles des modèles d’IA Claude Mythos Preview et Claude Fable 5 de l’entreprise américaine Anthropic pour certaines tâches.

Dans le mécanisme d’orchestration de plusieurs modèles, Google Cloud a été choisi comme infrastructure. Sakana AI indique que l’entreprise a été principalement fondée par des ingénieurs issus de Google et de Google DeepMind, ce qui rend l’adoption de Google Cloud naturelle. Chi Sun, responsable de la conception de l’infrastructure de Sakana Fugu, a salué Google Cloud comme une infrastructure de haute qualité et stable, offrant des services gérés capables de coordonner plusieurs modèles.

Chi Sun a également mentionné que Sakana Fugu est structuré en trois couches : la couche frontale, la couche de traitement intermédiaire et la couche de modèles, et que la disponibilité de tous les outils nécessaires à la construction de chaque couche a été l’une des raisons de son adoption.

Dans la couche frontale, la fonction de sécurité réseau Google Cloud Armor et la fonction de protection des modèles et agents Model Armor protègent les modèles contre les entrées inappropriées ou les attaques DDoS. L’authentification et la protection des utilisateurs, ainsi que la gestion des clés API, sont assurées par la plateforme de développement d’applications Web Firebase.

La couche de traitement intermédiaire gère les appels de modèles, le traitement des journaux et du cache, ainsi que l’écriture de données dans l’entrepôt de données BigQuery.

La couche de modèles combine plusieurs modèles en fonction de la requête d’entrée pour générer une réponse. Via l’environnement d’exécution sans serveur Cloud Run et la plateforme d’IA Gemini Enterprise Agent Platform (anciennement Vertex AI), elle appelle les modèles de Google (États-Unis), OpenAI (États-Unis), Anthropic, etc.

Ce texte est rédigé, traduit et republié à partir des informations de l'Internet mondial et de partenaires stratégiques, uniquement pour la communication entre lecteurs. En cas d'infraction au droit d'auteur ou d'autres problèmes, veuillez nous en informer à temps pour la modification ou la suppression. La reproduction de cet article est strictement interdite sans autorisation formelle. Mail : news@wedoany.com