La société d'intelligence artificielle OpenAI a dévoilé aux États-Unis son dernier modèle d'IA, GPT-5.4, seulement deux jours après le lancement de sa version précédente, GPT-5.3 Instant. Le modèle GPT-5.4 est proposé en deux versions, Thinking et Pro, toutes deux accessibles via une API payante et l'application Codex. La version Thinking est destinée aux abonnés ChatGPT Plus, tandis que la version Pro est conçue spécifiquement pour les utilisateurs professionnels. Les utilisateurs gratuits pourront également tester ce modèle dans le cadre de requêtes spécifiques.
Les principales caractéristiques du modèle GPT-5.4 incluent une amélioration de l'efficacité, OpenAI rapportant une réduction de 47 % de l'utilisation des tokens pour certaines tâches. Le modèle prend en charge un mode d'utilisation native de l'ordinateur, lui permettant d'opérer comme un humain sur l'ordinateur et à travers les flux de travail des applications. De plus, la nouvelle intégration ChatGPT permet à GPT-5.4 d'être directement intégré dans Microsoft Excel et Google Sheets, facilitant ainsi l'analyse financière et l'automatisation.
OpenAI indique que GPT-5.4 prend en charge des contextes allant jusqu'à 1 million de tokens via l'API, mais que le coût double lorsque l'entrée dépasse 272 000 tokens. Les tests de référence montrent que dans l'évaluation BrowseComp, GPT-5.4 surpasse la version précédente de 17 %, la version Pro atteignant un taux de réussite de 89,3 %. Dans le test OSWorld-Verified, GPT-5.4 affiche un taux de réussite de 75,0 %, se rapprochant de la performance humaine de 72,4 %.
Le modèle introduit également une fonction de recherche d'outils, réduisant l'utilisation des tokens et améliorant l'efficacité. Dans le domaine financier, les nouveaux produits alimentés par GPT-5.4 incluent ChatGPT pour Excel et la version bêta pour Google Sheets, visant à unifier les données de marché et les flux de travail. Un testeur précoce, Daniel Swiecki, déclare : « Dans nos évaluations financières internes, GPT-5.4 a amélioré la précision de 30 points de pourcentage. » Le PDG de Mercor, Brendan Foody, qualifie GPT-5.4 de meilleur modèle que son entreprise ait jamais testé.
Le modèle GPT-5.4 est positionné comme allant au-delà des simples questions-réponses, se concentrant sur des flux de travail professionnels continus, incluant l'orchestration d'outils et le traitement de contextes longs. OpenAI souligne une amélioration de l'exactitude factuelle, avec une probabilité d'erreur sur des affirmations individuelles inférieure de 33 % par rapport à la génération précédente. Bien que son prix soit plus élevé, un porte-parole affirme que ses capacités améliorées et ses gains d'efficacité lui permettent de rester compétitif sur le marché.









