Google DeepMind publie l'API Interactions
2026-06-30 11:48
Favoris

fr.wedoany.com Rapport : Google DeepMind a officiellement publié l'API Interactions, faisant passer Gemini de l'appel de modèle à l'exécution d'agent. Cette API peut traiter simultanément les appels de modèle Gemini et l'exécution d'agent sur un point de terminaison unifié (Unified Endpoint). Les développeurs n'ont qu'à transmettre l'ID du modèle aux tâches d'inférence et l'ID de l'agent aux tâches autonomes.

Auparavant, après qu'un développeur avait envoyé une invite (Prompt), l'API se contentait d'appeler le modèle et de renvoyer une réponse. Le changement clé de l'API Interactions est que le rôle de l'API est passé du simple appel de modèle à la gestion de l'exécution des tâches d'agent, permettant de prendre en charge l'exécution d'agent, la gestion de l'état des tâches, la connexion d'outils et le traitement en arrière-plan au sein d'un même flux.

Demis Hassabis, cofondateur et PDG de Google DeepMind. (Photo = Google DeepMind)

La fonction Agent géré (Managed Agent) permet aux développeurs de créer un bac à sable (Sandbox) Linux distant via un seul appel API. L'agent Gemini peut raisonner, exécuter du code, naviguer sur le Web et gérer des fichiers dans ce bac à sable.

L'API Interactions peut traiter simultanément les appels de modèle Gemini et l'exécution d'agent sur un point de terminaison unifié. (Photo = Site officiel de Google DeepMind)

Selon VentureBeat, l'API Interactions est une interface unifiée conçue pour que le grand modèle de langage (LLM) ne soit plus seulement un générateur de texte, mais se rapproche davantage d'un système d'exploitation distant. Cela signifie que le modèle passe d'un outil qui ne fait que générer des réponses à un système capable d'appeler plusieurs modèles, d'effectuer des appels répétés, d'utiliser des outils et même d'exécuter du code backend.

En termes de coûts, l'API Interactions stocke les historiques de conversation et le contenu des tâches sur les serveurs de Google, évitant ainsi aux développeurs de devoir renvoyer à chaque fois le même long contexte. Dans les services d'agent qui utilisent fréquemment de grands documents ou de longs historiques de conversation, cela peut réduire les coûts de jetons et la latence des réponses. Les clients de la version gratuite voient leurs enregistrements de tâches conservés pendant un jour, tandis que les utilisateurs payants peuvent les conserver pendant 55 jours. TechCrunch souligne que cela permet de maintenir l'état de l'API et de réduire les prix, mais que les entreprises traitant des données sensibles doivent également prendre en compte les questions de gouvernance et de résidence des données.

Ali Chebik, chef de produit du groupe Google DeepMind, a souligné sur le site officiel que l'API Interactions a été développée sur la base des retours des développeurs et que cette orientation ne changera pas après sa publication officielle.

Ce texte est rédigé, traduit et republié à partir des informations de l'Internet mondial et de partenaires stratégiques, uniquement pour la communication entre lecteurs. En cas d'infraction au droit d'auteur ou d'autres problèmes, veuillez nous en informer à temps pour la modification ou la suppression. La reproduction de cet article est strictement interdite sans autorisation formelle. Mail : news@wedoany.com