JD.com et des instituts de recherche lancent la technologie RLSD pour réduire les coûts de formation des modèles de raisonnement IA - Bulletin - Wedoany.com

Accueil Actualités Détails

JD.com et des instituts de recherche lancent la technologie RLSD pour réduire les coûts de formation des modèles de raisonnement IA

2026-04-29 15:14

Favoris

fr.wedoany.com Rapport : Le coût élevé de la formation des modèles de raisonnement IA préoccupe depuis longtemps les équipes en entreprise. Des chercheurs de JD.com, en collaboration avec plusieurs institutions académiques, ont proposé un nouveau paradigme de formation appelé RLSD, visant à construire des agents de raisonnement personnalisés avec moins de ressources de calcul. Cette technologie combine l'apprentissage par renforcement et l'auto-distillation, résolvant les problèmes de signaux clairsemés ou de surcoût de calcul rencontrés dans les méthodes traditionnelles.

rlvr

Lors des expériences, les modèles formés avec RLSD ont atteint une précision moyenne de 56,18 % sur plusieurs référentiels de raisonnement visuel, surpassant le modèle de base et la méthode standard RLVR. Le co-auteur de l'article, Yang Chenxu, indique que le RLSD découple la direction et l'amplitude de la mise à jour, utilise un signal de récompense vérifiable pour déterminer la direction, et réalise un retour d'information fin au niveau de chaque token via l'auto-distillation. Cela évite les problèmes de fuite d'information et maintient la stabilité de la formation.

Le RLSD ne nécessite qu'une seule propagation avant supplémentaire, et sa vitesse de convergence est environ deux fois plus rapide que celle des méthodes traditionnelles. Il est adapté aux tâches offrant une récompense vérifiable, telles que la compilation de code ou la vérification mathématique, et peut exploiter de manière flexible des informations privilégiées. Cette technologie peut s'intégrer facilement dans les frameworks open source existants, ouvrant ainsi une nouvelle voie pour les entreprises souhaitant optimiser leurs modèles avec leurs données internes.

Texte compilé par Wedoany. Toute citation par IA doit mentionner la source « Wedoany ». En cas de contrefaçon ou d'autre problème, veuillez nous en informer rapidement ; nous modifierons ou supprimerons le contenu le cas échéant. Courriel : news@wedoany.com

Information et communication Ingénierie de l'intelligence artificielle

Préc：Le métro de Jakarta et le métro de Shenzhen signent un protocole d'accord de coopération

Suiv：Lancement de la grue sur chenilles auxiliaire pour éoliennes Xugong XLC150M

Demander un devis

Véhicule sans conducteur à caisse X3 Xinshiqi

Neolix Beijing Technology Co., Ltd.

Demander un devis

BUC intégré double bande Ka&Ku

COXSAT TECHNOLOGY CO., LTD.

Demander un devis

Solution SIS pour l’instrumentation de sécurité

Beijing Consen Automation Technology Co., Ltd.

Demander un devis

Tour de communication à quatre colonnes pour les lignes dédiées aux passagers

Henan Dingli Pole & Tower Co.,Ltd.

Demander un devis

Radar de profil de vent troposphérique TWP16 en bande P

China Huayun Meteorological Technology Group Co., Ltd.

Demander un devis

Conduite automatique totale (FAO)

UniTTEC Co., Ltd.

Demander un devis

25 Système de contrôle électro-hydraulique pour supports hydrauliques SAC

Beijing Tianma Intelligent Control Technology Co., Ltd.

Demander un devis

Profilés d’armoire en T

Xinli Tongchuang Electronic Equipment Co., Ltd.

Demander un devis

Projet d’installation mécanique et électrique pour l’industrialisation de matériaux semiconducteurs composés haut de gamme et de puces

Wuhan Huakang Century Clean Technology Co., Ltd.

Demander un devis

Câble optique à tube central GYXTW

DONGGUAN TW-SCIE CO., LTD.

Demander un devis

Surveillance intelligente

Shenzhen Invt Electric Co., Ltd.

Demander un devis /unit

Tablette PC industrielle robuste 10 pouces Win10 Win11 Pro Intel N100 16+512 Go IP67 4G avec code-barres NFC RJ45 et station d'accueil

Highton Electronics Co., Ltd.

Recommandés

Broadcom, Apollo et Blackstone lancent une plateforme IA, première transaction d’environ 35 milliards de dollars

Le métro de Moscou prévoit de migrer des dizaines de milliers d’équipements vers Astra Linux en trois ans

AMD et Rackspace signent un contrat de 30 MW pour une infrastructure de calcul IA

Les puces DDR5 de ChangXin Memory Technologies adoptées par Corsair, HP et Dell en cours de certification

58 millions de couronnes norvégiennes pour financer des doctorats en intelligence artificielle

Le groupe Telecel intensifie ses investissements dans le réseau ghanéen

La startup britannique d’IA CuspAI obtient 400 millions de dollars de financement

Samsung, entreprise sud-coréenne, obtient des commandes de puces AI6 de Tesla d'une valeur de 165 milliards de dollars, ainsi que des commandes d'AMD et d'autres entreprises

Lightpath transforme ses opérations grâce à Oracle Cloud Scale Billing et à l'IA

Ericsson et SoftBank présentent le découpage du réseau 5G SA au Grand Prix du Japon de F1

Derniers Bulletins

Siemens Healthineers investit 30 millions de dollars dans une installation de médicaments radiopharmaceutiques au Royaume-Uni

Zeiss Medical China et Aier Eye Hospital signent un contrat pour l’acquisition de 25 appareils VISUMAX 800

L’hôpital Kauvery introduit la technologie d’ablation par champ pulsé dans le Tamil Nadu

Woodcliffe dévoile un projet de 32 étages pour Summerhill à Toronto

Aeroméxico lance une nouvelle ligne vers Guanajuato le 27 juillet

Rapport sur le dessalement au Chili : l’énergie et le CAPEX représentent 80 à 90 % des coûts

Le Chili prévoit de lancer des projets de concessions autoroutières d'une valeur de 2,8 milliards de dollars au second semestre de cette année

Unifrango investit plus de 20 millions de reais dans l’extension de son centre de distribution au Brésil

L'aéroport de McAllen avance son plan d'expansion de 160 à 280 millions de dollars

Le port de Rotterdam va développer un hub logistique de 38 hectares pour la chaîne du froid