fr.wedoany.com Rapport : Google a directement intégré la capacité de contrôle des appareils dans le modèle Gemini 3.5 Flash. L'entreprise a récemment lancé la fonctionnalité « Computer Use » pour son modèle d'IA Gemini 3.5 Flash, permettant à ce dernier de contrôler directement les appareils physiques des utilisateurs et d'exécuter des actions à leur place. Auparavant, Google proposait déjà aux consommateurs, via Gemini Spark, une fonctionnalité d'IA agent capable de contrôler des ordinateurs virtuels et des navigateurs à distance. Cependant, la nouvelle fonctionnalité Computer Use étend ce contrôle aux appareils physiques présents devant l'utilisateur. Google avait auparavant proposé un modèle indépendant, Gemini 2.5 Computer Use, dédié au contrôle des appareils. Désormais, il est directement intégré dans Gemini 3.5 Flash, permettant aux développeurs d'accéder, sur une même plateforme, à diverses capacités telles que le contrôle des appareils, la recherche et les cartes, sans avoir à basculer vers un modèle spécialisé.

Le modèle indépendant précédent, Gemini 2.5 Computer Use, était principalement optimisé pour le contrôle via navigateur et présentait certaines limitations. Google indique que cette mise à niveau offrira une exécution plus réactive pour les « tâches d'automatisation de longue durée et en entreprise ». Face aux préoccupations de sécurité que pourrait susciter le contrôle total des appareils par l'IA, Google a introduit plusieurs mesures. Cette fonctionnalité est actuellement réservée aux développeurs et aux environnements professionnels, pour des cas d'utilisation tels que les tests automatisés d'interfaces utilisateur, la recherche sur des sites web et applications, ou la saisie automatique de données dans des logiciels plus anciens. L'accès se fait via l'API Gemini ou la plateforme Gemini Enterprise Agent ; l'application grand public Gemini ne peut pas déclencher cette fonctionnalité.

En matière de sécurité, Gemini 3.5 Flash reprend le protocole de collaboration homme-machine du modèle précédent Gemini 2.5 Computer Use, garantissant que les « opérations sensibles », comme les transactions financières, nécessitent une autorisation humaine. Cette mise à jour ajoute deux nouvelles fonctionnalités de sécurité. La première est la détection automatique des vecteurs d'attaque, par exemple les « injections indirectes d'invites » : si un texte d'invite malveillant caché est détecté dans une page web, l'exécution est interrompue. La seconde exige une confirmation explicite de l'utilisateur avant d'exécuter des opérations sensibles ou irréversibles. Google précise que ces mesures de sécurité essentielles sont des configurations optionnelles ; il incombe aux développeurs de les utiliser et ils assument tous les risques liés à leur exécution.
En tant que partie intégrante du modèle natif Gemini 3.5 Flash, l'activation de la fonctionnalité Computer Use ne nécessite aucun frais supplémentaire. Le prix de ce nouveau modèle est de 1,50 $ par million de tokens d'entrée, légèrement supérieur à celui du modèle Gemini 2.5 (1,25 $). Cependant, la fonction de cache de contexte offerte par le nouveau modèle peut réduire considérablement le coût global. Pour les développeurs traitant de nombreuses tâches répétitives, les gains potentiels compenseront probablement la légère augmentation du prix unitaire par token.
Texte compilé par Wedoany. Toute citation par IA doit mentionner la source « Wedoany ». En cas de contrefaçon ou d'autre problème, veuillez nous en informer rapidement ; nous modifierons ou supprimerons le contenu le cas échéant. Courriel : news@wedoany.com









