Naver dévoile les technologies clés de son IA Tab, avec un score de capacité de service de 108 points
2026-07-05 16:23
Favoris

fr.wedoany.com Rapport : Lee Ki-chang, administrateur de Naver Cloud, a déclaré lors de la session Tech Deep Talk tenue le 2 dans le quartier de Gangnam à Séoul que son service de recherche conversationnelle AI Tab utilise un LLM natif produit (Product Native LLM) développé sur la base d’HyperCLOVA X. Il a affirmé que l’objectif de Naver est d’acquérir un avantage clair en matière de capacité de service, de maintenir un niveau de compétence de base supérieur à celui des concurrents, et de réduire autant que possible l’écart avec les meilleurs niveaux mondiaux en compétences spécialisées.

AI Tab est un service de recherche conversationnelle officiellement lancé par Naver le 26 du mois dernier. Il comprend l’intention et le contexte de recherche des utilisateurs pour fournir des réponses, et se connecte à des actions concrètes telles que les achats et la recherche de lieux. Ce LLM natif produit intègre pleinement les données, les scénarios de service et les retours des utilisateurs de Naver dans la conception du modèle.

Lee Ki-chang, administrateur de Naver Cloud, effectue une démonstration lors de la session « Naver Tech Deep Talk session » tenue le 2 dans le quartier de Gangnam à Séoul. (Photo = Naver)

Ce modèle est développé autour de trois piliers : les données, l’architecture et l’entraînement. La qualité des données d’apprentissage est améliorée grâce à un filtre de qualité des documents, et un « pipeline de collecte de données non structurées » (비스형 데이터 수집 파이프라인) est construit pour refléter les données des domaines de la recherche, des achats, des lieux et des informations sur la vie pendant la phase de pré-entraînement. Sur le plan architectural, une structure MoE (Mixture of Experts) est introduite, garantissant une vitesse de réponse plus rapide et un débit plus élevé que le HCX (HyperCLOVA X) d’origine, avec une latence de bout en bout (E2E Latency) réduite. Ce modèle améliore la charge de calcul pour qu’elle soit linéairement proportionnelle à la longueur d’entrée, maintenant une vitesse de réponse stable et un débit élevé dans des contextes longs.

Han Seung-gyun, chef d’équipe chez Naver, explique les technologies appliquées à AI Tab lors de la session « Naver Tech Deep Talk session » tenue le 2 dans le quartier de Gangnam à Séoul. (Photo = Naver)

Lors de la phase d’entraînement, les ressources de calcul allouées à l’apprentissage par renforcement ont été plus que doublées par rapport au HCX d’origine. Une nouvelle technique d’apprentissage par renforcement de clarification (Clarify RL) est appliquée, récompensant les questions auxquelles il est impossible de répondre en demandant des conditions supplémentaires, améliorant ainsi le phénomène d’hallucination. La technique de distillation sur politique (OPD, On-Policy Distillation) est également utilisée : les réponses générées par le modèle en cours d’entraînement sont modifiées par un modèle haute performance au niveau des jetons (token), ce qui compense efficacement les faiblesses dans les domaines spécialisés. Cette structure permet une amélioration continue : à mesure que les performances du modèle haute performance augmentent, le modèle en cours d’entraînement se renforce également.

Dans les résultats du benchmark interne de Naver évaluant la qualité d’exécution des tâches telles que « recherche, achat, réservation » du modèle appliqué à AI Tab, le score de capacité de service est de 108 points, supérieur à la moyenne des concurrents de 100 points et au meilleur score des concurrents de 106 points. Les compétences de base, telles que l’exécution des instructions et l’appel d’outils en japonais, obtiennent 104 points, dépassant la moyenne des concurrents de 100 points. Les compétences spécialisées pour résoudre des problèmes scientifiques de niveau doctoral obtiennent 97 points, légèrement en dessous de la moyenne des concurrents de 100 points. L’administrateur Lee Ki-chang a expliqué que, bien que les compétences de base et spécialisées puissent être améliorées avec des efforts, la stratégie consiste à investir davantage dans les capacités liées au service.

Sur place, Naver a également dévoilé la technologie clé pour piloter stablement AI Tab, appelée « Harness Engineering », qui fonctionne en quatre étapes : comprendre l’intention de l’utilisateur et gérer le contexte long des conversations, raisonner sur les services associés tels que la recherche, les achats et les lieux, fournir des sources et exécuter des connexions.

Naver a présenté sa vision d’évolution vers un agent multimodal (Multimodal Agent) centré sur Smart Lens, appliqué à la barre de recherche. Depuis le lancement de Smart Lens en 2017 pour offrir un service de recherche d’images, en passant par la recherche combinée d’images et de texte en 2022, jusqu’au lancement l’année dernière de Smart Lens X AI Briefing pour la compréhension et le résumé d’images, la technologie n’a cessé d’être améliorée.

Yoon Sang-doo, chef d’équipe, s’adresse aux journalistes lors de la session « Naver Tech Deep Talk session » tenue le 2 dans le quartier de Gangnam à Séoul. (Photo = Naver)

Yoon Sang-doo, chef d’équipe chez Naver, a déclaré que l’agent IA actuel de Naver est principalement basé sur des entrées textuelles, mais qu’à l’avenir, il évoluera vers un agent multimodal capable de comprendre l’intention via des images et de se connecter à des actions concrètes.

Ce texte est rédigé, traduit et republié à partir des informations de l'Internet mondial et de partenaires stratégiques, uniquement pour la communication entre lecteurs. En cas d'infraction au droit d'auteur ou d'autres problèmes, veuillez nous en informer à temps pour la modification ou la suppression. La reproduction de cet article est strictement interdite sans autorisation formelle. Mail : news@wedoany.com
Produits Associés