fr.wedoany.com Rapport : Tencent Cloud (Chine) a récemment conclu un partenariat stratégique avec Soniox, une entreprise spécialisée dans l’IA vocale basée à San Francisco (États-Unis). Cette collaboration intègre la technologie de transcription vocale de Soniox à l’infrastructure mondiale TRTC (Real-Time Audio-Video) de Tencent Cloud, infrastructure qui permet de développer des applications vocales en temps réel multilingues et à faible latence pour des scénarios professionnels tels que les centres de contact intelligents, les assistants vocaux, la traduction en temps réel et la transcription de réunions.
Cette collaboration se situe à l’intersection du « traitement du langage » et de la « communication en temps réel », avec pour objectif principal de réduire les barrières au déploiement d’applications vocales basées sur l’IA à l’échelle mondiale. Soniox fournit des capacités de reconnaissance vocale de haute précision et à faible latence, prenant en charge plus de 60 langues et capable de gérer les changements de langue au sein d’une même phrase. De son côté, TRTC de Tencent Cloud offre un réseau de communication en temps réel de niveau professionnel, couvrant plus de 3 200 nœuds mondiaux, avec une latence globale inférieure à 300 millisecondes, une réduction du bruit par IA et une résistance aux réseaux faibles. En combinant ces deux technologies, les développeurs peuvent intégrer directement l’interface de transcription vocale de Soniox dans la console Tencent Cloud pour construire des applications vocales basées sur l’IA destinées à différents marchés. Pour les entreprises de commerce électronique transfrontalier, d’éducation en ligne, de réunions à distance, de collaboration professionnelle, de jeux sociaux, de services financiers et les entreprises SaaS internationalisées, les applications vocales étaient auparavant confrontées à trois types de problèmes : premièrement, la qualité du réseau varie considérablement d’un pays à l’autre, ce qui entraîne des retards et des pertes de paquets dans la transmission vocale en temps réel ; deuxièmement, la reconnaissance multilingue nécessite l’adaptation à différents modèles et interfaces, ce qui augmente les coûts de développement et de maintenance ; troisièmement, les scénarios tels que le service client, la traduction et les comptes rendus de réunions exigent une grande précision et une rapidité de réponse, et il est difficile d’obtenir une expérience stable en s’appuyant uniquement sur un modèle de reconnaissance vocale ou sur une seule liaison de communication. En plaçant le réseau de communication en temps réel et la technologie de transcription vocale dans la même chaîne de livraison, Tencent Cloud et Soniox aident les entreprises à intégrer la saisie vocale, la transmission, la reconnaissance, la sortie de texte et le traitement ultérieur par IA en une infrastructure vocale en temps réel plus complète, évitant ainsi d’avoir à assembler séparément des services de communication, de reconnaissance vocale et de traitement multilingue.
Ce partenariat permet aux entreprises de développer des applications vocales pour le marché anglophone ainsi que pour des marchés multilingues comme l’arabe, l’hindi et le malais, avec des applications incluant les centres de contact intelligents, les assistants vocaux, la traduction en temps réel et la transcription de réunions.
L’IA vocale pour les entreprises passe d’une fonction ponctuelle à une phase de déploiement en production. Auparavant, la transcription vocale était principalement utilisée pour les comptes rendus de réunions, la génération de sous-titres ou l’organisation d’enregistrements de service client, avec un traitement principalement hors ligne et une reconnaissance monolingue. Avec la généralisation de l’IA générative, des robots de service client en temps réel, de la collaboration transfrontalière et des appareils intelligents, la voix devient une interface essentielle pour les applications professionnelles. Ce qui influence réellement l’efficacité du déploiement ne se limite pas à la capacité du modèle de reconnaissance à comprendre une phrase, mais inclut également la qualité de la liaison de transmission de la voix de l’utilisateur vers le cloud, la vitesse de retour des résultats de reconnaissance, la stabilité dans des environnements à faible réseau, la capacité de reconnaissance continue dans des scénarios multilingues, ainsi que la capacité à se connecter de manière fluide avec les grands modèles de langage, les bases de connaissances, les systèmes de tickets et les systèmes de traduction. TRTC de Tencent Cloud fournit des nœuds mondiaux et une faible latence au niveau de la couche de transmission audio-vidéo en temps réel, tandis que Soniox offre une reconnaissance multilingue et une gestion des changements de langue au sein d’une même phrase au niveau de la couche de transcription vocale. En combinant ces deux éléments, les entreprises peuvent intégrer plus rapidement l’interface vocale dans les centres de contact, les réunions en ligne, les diffusions en direct transfrontalières, la formation à distance et les applications mobiles. Pour l’industrie des technologies de l’information et de la communication, ce type de collaboration montre également que les plateformes de communication en temps réel évoluent, passant d’outils d’appel audio-vidéo à des canaux sous-jacents pour l’IA vocale, la traduction, la collaboration et les services automatisés. À l’avenir, celui qui parviendra à orchestrer les liaisons de communication, la reconnaissance vocale, le traitement multilingue et les applications d’IA en une plateforme unifiée sera mieux placé pour répondre aux besoins de déploiement mondial des entreprises et de gestion des utilisateurs multilingues.
Les variables futures de ce partenariat se concentrent sur la vitesse d’adoption par les clients professionnels, la stabilité de la reconnaissance multilingue dans des environnements bruyants réels, l’interopérabilité des interfaces avec les applications de grands modèles de langage, ainsi que les exigences de conformité des données dans différents pays et régions. Alors que de plus en plus d’entreprises étendent leurs services client, réunions, formations et activités marketing aux marchés mondiaux, la transcription vocale en temps réel ne sera plus seulement une fonction auxiliaire, mais deviendra une capacité de base essentielle pour la communication interlinguistique, les services automatisés et les opérations intelligentes. La collaboration entre Tencent Cloud et Soniox offre un nouvel exemple de combinaison de produits pour les fournisseurs de services cloud chinois et les entreprises américaines d’IA vocale sur le marché mondial des communications d’entreprise.
Texte compilé par Wedoany. Toute citation par IA doit mentionner la source « Wedoany ». En cas de contrefaçon ou d'autre problème, veuillez nous en informer rapidement ; nous modifierons ou supprimerons le contenu le cas échéant. Courriel : news@wedoany.com









