Google-États-Unis dévoile le modèle d'IA Gemini 3.1 Flash Lite, améliorant significativement le rapport coût-efficacité
2026-03-04 14:05
Favoris

Le géant technologique américain Google a récemment lancé un nouveau modèle d'IA, Gemini 3.1 Flash-Lite. Ce modèle a été significativement optimisé en termes de coût et de vitesse, ciblant principalement les entreprises et les développeurs, avec pour objectif de fournir des solutions intelligentes à grande échelle.

Gemini 3.1 Flash-Lite est positionné comme le modèle offrant le meilleur rapport coût-efficacité et les temps de réponse les plus rapides de la série Gemini 3. Son lancement intervient seulement quelques semaines après la présentation du modèle haute performance Gemini 3.1 Pro en février, complétant ainsi la stratégie de stratification de Google pour aider les entreprises à étendre leurs capacités intelligentes à travers toutes les couches de leur infrastructure.

Dans les applications d'IA à haut débit, la latence est l'un des indicateurs clés affectant l'expérience utilisateur. Flash-Lite est conçu pour une réponse instantanée. Selon des tests de référence internes et des évaluations tierces, son temps de premier jeton est 2,5 fois plus rapide que celui de l'ancien Gemini 2.5 Flash, avec une vitesse de sortie globale améliorée de 45 %, atteignant 363 jetons par seconde.

Ce modèle introduit des fonctionnalités de niveau de réflexion, permettant aux développeurs d'ajuster dynamiquement l'intensité du raisonnement. Pour les tâches simples, il peut être réglé à la baisse pour privilégier vitesse et coût ; pour les applications complexes, telles que l'exploration de code ou la création de simulations, il peut être réglé à la hausse pour un raisonnement approfondi.

Bien que son nom contienne « Lite », les données de performance montrent que ses capacités rivalisent avec celles de systèmes plus volumineux. Sur le classement Arena.ai, Flash-Lite a obtenu un score Elo de 1432, en compétition avec des modèles ayant plus de paramètres. Les résultats clés des tests de référence montrent des performances de 86,9 % dans le domaine des connaissances scientifiques, 76,8 % en compréhension multimodale et 88,9 % en questions-réponses multilingues.

La conformité de la sortie structurée est un point fort de Flash-Lite. Sur le test de référence LiveCodeBench, il a obtenu un score de 72,0 %, surpassant certains concurrents, tout en prenant en charge la synthèse de diagrammes complexes et l'extraction de connaissances vidéo.

Comparé à Gemini 3.1 Pro, Flash-Lite se concentre davantage sur une exécution à haute capacité, traitant des tâches quotidiennes comme la traduction et la modération, tandis que le modèle Pro excelle dans le raisonnement approfondi et le codage complexe. Grâce à une architecture en cascade, Google permet aux entreprises d'utiliser Pro pour la planification initiale, puis de confier les tâches répétitives à Flash-Lite à moindre coût.

En termes de coût, Gemini 3.1 Flash-Lite est tarifé à 0,25 dollar pour 1 million de jetons d'entrée et 1,50 dollar pour 1 million de jetons de sortie, ce qui est moins cher que des concurrents comme Claude 4.5 Haiku. Comparé à Gemini 3.1 Pro, dans des cas d'utilisation à contexte élevé, Flash-Lite est 12 à 16 fois moins cher.

Les retours des premiers testeurs sont positifs. Andrew Carr, scientifique en chef chez Cartwheel, souligne : « 3.1 Flash-Lite est un modèle très compétent. Il est extrêmement rapide, mais parvient quand même à suivre toutes les instructions d'une certaine manière… Son ratio intelligence/vitesse est inégalé par tout autre modèle. » Kolby Nottingham, responsable de l'IA chez Latitude, partage que ce modèle a augmenté le taux de réussite de 20 % et réduit le temps de raisonnement de 60 %.

Gemini 3.1 Flash-Lite et Pro sont disponibles via Google AI Studio et Vertex AI, suivant un modèle commercial de logiciel en tant que service. Actuellement, Flash-Lite est en phase de prévisualisation, permettant à Google d'affiner ses performances en fonction des retours. Pour les développeurs, la transition vers le nouveau modèle représente une mise à niveau des performances au même prix ou à un prix inférieur.

Ce lancement de Google marque une nouvelle étape dans la course à l'IA. En combinant le raisonnement approfondi du modèle Pro et l'exécution efficace de Flash-Lite, il offre aux entreprises des solutions d'IA fiables et instantanées, réduisant ainsi les obstacles à l'intelligence à grande échelle.

Ce texte est rédigé, traduit et republié à partir des informations de l'Internet mondial et de partenaires stratégiques, uniquement pour la communication entre lecteurs. En cas d'infraction au droit d'auteur ou d'autres problèmes, veuillez nous en informer à temps pour la modification ou la suppression. La reproduction de cet article est strictement interdite sans autorisation formelle. Mail : news@wedoany.com
Recommandés
Le Premier ministre chinois Li Qiang présente le rapport sur le travail du gouvernement à la quatrième session de la 14e Assemblée populaire nationale
2026-03-05
Rapport d'activité du gouvernement 2026 : Cultiver et développer les industries d'avenir telles que l'énergie du futur, les technologies quantiques et la 6G
2026-03-05
Qualcomm forme une alliance mondiale d'entreprises à Barcelone, en Espagne, visant un déploiement commercial de réseaux 6G natifs IA d'ici 2029
2026-03-04
Google-États-Unis dévoile le modèle d'IA Gemini 3.1 Flash Lite, améliorant significativement le rapport coût-efficacité
2026-03-04
NVIDIA s'associe à des partenaires mondiaux pour faire progresser la construction de plateformes AI natives 6G dans de nombreux pays, dont les États-Unis
2026-03-03
Les revenus du segment Réseau de NVIDIA dépassent les 31 milliards de dollars, devenant un pilier majeur du développement de l'IA
2026-02-28
Samsung et Orange élargissent leur collaboration sur le vRAN et l'Open RAN pour accélérer le déploiement des réseaux IA en Europe
2026-02-27
Lancement de l'IA Grok de Tesla en Europe suscite des préoccupations quant à la sécurité routière
2026-02-27
Altarea et Vantage s'associent pour développer un campus de centres de données de 400 MW dédié à l'IA près de Bordeaux
2026-02-26
AWS propose trois grands axes pour l'industrie des télécommunications : modernisation du cloud, automatisation par IA agentive et préparation à la 6G
2026-02-26