Une équipe suisse développe le modèle TutorRL à 7 milliards de paramètres, équilibrant connaissances disciplinaires et compétences pédagogiques

2026-06-15 16:15

Favoris

fr.wedoany.com Rapport : Jakub Mačina, postdoctorant suisse, en collaboration avec le professeur d’informatique Mrinmaya Sachan et le spécialiste des sciences de l’apprentissage Manu Kapur, a développé un modèle d’IA d’apprentissage nommé « TutorRL », visant à équilibrer l’expertise disciplinaire et les compétences pédagogiques. Ce modèle ne nécessite que 7 milliards de paramètres, bien moins que les modèles de langage dominants actuels qui en comptent des centaines de milliards, voire des billions, et il ne s’écarte pas facilement du sujet lors d’interactions d’apprentissage pouvant aller jusqu’à 20 étapes.

Les recherches de Mačina se concentrent sur la manière de faire des grands modèles de langage des coachs d’apprentissage à valeur pédagogique. Il souligne que la plupart des grands modèles de langage existants sont optimisés pour générer des réponses et des solutions, plutôt que pour guider les apprenants vers une réflexion autonome au cours du processus d’apprentissage. Même lorsque des instructions explicites demandent un soutien à l’apprentissage, les résultats sont généralement insatisfaisants. Pour tester l’aptitude pédagogique de différents modèles, Mačina, en collaboration avec des chercheurs de l’Université technique de Darmstadt (TU Darmstadt), a développé le benchmark d’enseignement mathématique « MathTutorBench ». Ce benchmark, basé sur des dialogues avec des enseignants et des données de processus pédagogiques, établit un système de notation pour des compétences pédagogiques spécifiques, permettant de comparer et d’analyser les réponses des grands modèles de langage. Les tests montrent que différents modèles présentent souvent un compromis entre l’expertise disciplinaire et les compétences pédagogiques, et que la plupart des modèles perdent le fil et s’écartent du sujet lors de réponses étape par étape.

Dans un second projet, Mačina a développé le modèle TutorRL. Ce modèle est entraîné par des interactions multi-étapes entre un élève virtuel et un enseignant virtuel, sans nécessiter de données d’entraînement coûteuses. Pendant l’entraînement, un autre modèle surveille le processus pédagogique et évalue les réponses de l’enseignant virtuel, permettant ainsi un « apprentissage par renforcement ». Mačina indique que le grand avantage de cette méthode est qu’elle ne nécessite pas de données massives et qu’elle peut utiliser des modèles de langage plus petits. Comparé aux derniers modèles d’OpenAI ou de Google, qui comptent des centaines de milliards, voire des billions de paramètres, la taille de 7 milliards de paramètres de TutorRL est plus modeste. Les résultats préliminaires montrent que TutorRL offre un meilleur équilibre entre l’expertise disciplinaire et les compétences pédagogiques que les grands modèles de langage traditionnels, et qu’il s’écarte moins facilement du sujet. Le modèle peut également expliquer les raisons de ses réponses et décisions au cours de l’apprentissage, facilitant ainsi la compréhension et le suivi du processus pédagogique par les enseignants.

TutorRL est désormais disponible gratuitement en open source et a été téléchargé plus d’un millier de fois. Cependant, le modèle n’a pas encore été testé et évalué auprès d’apprenants en classe ; il est actuellement adapté uniquement à l’enseignement des mathématiques au niveau du lycée et du début du premier cycle universitaire. Mačina estime qu’à long terme, le modèle pourrait également être utilisé pour les disciplines MINT (mathématiques, informatique, sciences naturelles et technologie) et que ses performances sont suffisantes pour soutenir les cours de master. Il précise que cette recherche n’est pas seulement pertinente pour l’enseignement, mais qu’elle revêt une importance fondamentale pour le développement futur de l’intelligence artificielle, car la résolution collaborative de problèmes deviendra centrale dans de nombreux domaines professionnels à l’avenir, et le jugement humain restera crucial.

Texte compilé par Wedoany. Toute citation par IA doit mentionner la source « Wedoany ». En cas de contrefaçon ou d'autre problème, veuillez nous en informer rapidement ; nous modifierons ou supprimerons le contenu le cas échéant. Courriel : news@wedoany.com