fr.wedoany.com Rapport : Les 2 et 3 juin, Microsoft a publié une mise à jour des Windows AI APIs lors de la Build 2026, avec l'ajout d'une API de reconnaissance vocale côté client et le lancement de deux types de petits modèles de langage destinés à une exécution locale : Aion 1.0 Instruct et Aion 1.0 Plan. Ces capacités s'adressent principalement aux développeurs Windows 11, permettant la transcription vocale en texte, le traitement intelligent du texte et l'exécution d'actions agentives locales sur PC.
Cette mise à jour rapproche les capacités de traitement du langage du terminal. La nouvelle API de reconnaissance vocale permet de générer des transcriptions en temps réel ou par lots à partir d'un microphone, d'un flux audio ou d'un fichier audio, et peut être utilisée pour la génération de sous-titres, la saisie dictée, les applications audio/vidéo et les outils d'accessibilité. Microsoft souligne que, fonctionnant localement, cette capacité peut produire des transcriptions même sans connexion réseau, réduisant ainsi la dépendance à l'inférence cloud. Pour les logiciels d'entreprise, les outils de réunion, les enregistrements industriels, la maintenance à distance et les systèmes de formation, la transcription vocale côté client offre l'avantage de réduire la latence et les coûts d'appel cloud, tout en permettant de traiter localement certaines données vocales sensibles. Alors que l'IA s'intègre dans davantage de terminaux professionnels et bureautiques, la reconnaissance vocale passe d'un module fonctionnel isolé à une capacité fondamentale au niveau du système d'exploitation.
Aion 1.0 Instruct est un petit modèle de langage conçu pour les charges de travail côté client, capable de prendre en charge des tâches intelligentes de texte telles que le résumé, la reformulation, la reconnaissance d'intention et l'accessibilité.
Aion 1.0 Plan, quant à lui, est destiné aux scénarios de raisonnement agentif local. Avec 14 milliards de paramètres, il prend en charge une longueur de contexte de 32 000 tokens et des capacités d'appel d'outils, aidant les applications à comprendre l'intention de l'utilisateur, appeler des outils, gérer des fichiers et orchestrer des sous-agents. Microsoft prévoit que ce modèle fasse partie de Windows et s'exécute sur les appareils éligibles, permettant à certains processus agentifs de passer du cloud au terminal local. Pour les développeurs, cela signifie que les applications de bureau pourront à l'avenir appeler directement des capacités de compréhension de texte, de reconnaissance vocale et d'orchestration d'outils au niveau du système d'exploitation, sans avoir à intégrer des services de modèles externes pour chaque application. Pour les services informatiques des entreprises, les modèles côté client soulèvent également de nouvelles questions de gouvernance, notamment les autorisations des modèles, les limites d'accès aux fichiers, l'identification des utilisateurs, la conservation des données, les performances des appareils et l'audit inter-applications. L'adoption à grande échelle dans les environnements professionnels dépendra de la maturité simultanée des capacités d'IA locales et des mécanismes de sécurité.
Microsoft a également annoncé que les Windows AI APIs seront étendues à davantage de PC Windows 11. Outre les NPU, certaines capacités seront également prises en charge par les CPU et les GPU. L'API de reconnaissance vocale sera initialement disponible en anglais, puis progressivement étendue à d'autres marchés mondiaux. Avec l'intégration des modèles côté client, de la reconnaissance vocale et des capacités agentives locales dans l'écosystème de développement Windows, les technologies de traitement du langage passent des interfaces de services cloud au niveau du système d'exploitation du terminal, devenant des composants fondamentaux essentiels pour le développement d'applications, l'interaction accessible et les flux de travail intelligents en entreprise.
Texte compilé par Wedoany. Toute citation par IA doit mentionner la source « Wedoany ». En cas de contrefaçon ou d'autre problème, veuillez nous en informer rapidement ; nous modifierons ou supprimerons le contenu le cas échéant. Courriel : news@wedoany.com









