Neurometric lève 4 millions de dollars et lance une plateforme d’ingénierie des tokens

2026-06-26 10:17

Favoris

fr.wedoany.com Rapport : La société d’infrastructure IA Neurometric AI lance une plateforme automatisée d’ingénierie des tokens et annonce avoir bouclé un tour de financement de 4 millions de dollars plus tôt cette année. Cette plateforme vise à aider les entreprises à gérer les coûts et les performances des charges de travail des agents.

Lorsque les entreprises font passer leurs agents IA de la phase expérimentale à la phase de production, un seul flux de travail peut générer des dizaines d’appels de modèles. De nombreuses entreprises envoient encore chaque tâche à un modèle de pointe (frontier model), même si des modèles plus petits et moins coûteux peuvent obtenir des résultats identiques ou meilleurs. Neurometric évalue ces appels un par un, modifie les invites (prompts) si nécessaire et achemine chaque tâche vers le modèle le plus rentable capable d’atteindre le seuil de performance requis ; lorsqu’aucune option appropriée n’est disponible, elle crée un petit modèle de langage (small language model) spécialement conçu. Pour les charges de travail simples et à volume élevé, la plateforme génère automatiquement des petits modèles de langage spécialisés afin d’optimiser la vitesse et le coût des tâches.

« Au cours de l’année écoulée, les entreprises ont prouvé que les agents IA peuvent exécuter des tâches de plus en plus complexes. Aujourd’hui, elles doivent démontrer que l’économie de ces agents reste viable lorsqu’ils sont déployés à grande échelle », a déclaré Rob May, PDG de Neurometric. « Chaque appel de modèle est aussi une décision de tarification, et ces décisions s’accumulent tout au long du flux de travail des agents. L’ingénierie des tokens offre aux entreprises un moyen de maîtriser les coûts sans sacrifier la qualité. »

Actuellement, les entreprises s’appuient sur des tests manuels et des solutions ponctuelles pour décider quels modèles doivent traiter différentes tâches IA. Avec l’arrivée de nouveaux modèles sur le marché et les variations de prix, de vitesse et de performance, ces choix peuvent rapidement devenir obsolètes. Neurometric intègre en une seule plateforme le routage de modèles (model routing), la création de petits modèles de langage et l’accès à un marché de petits modèles de langage (SLM) pré-entraînés pour des tâches spécifiques. Son gestionnaire de points de terminaison de tâches (Task Endpoint Manager) évalue les requêtes entrantes en fonction des données actualisées de performance et de tarification des modèles, puis achemine chaque tâche selon les exigences du client en matière de précision, de coût et de latence. Lorsqu’aucun modèle existant ne répond à ces exigences, son créateur automatique de petits modèles de langage (Auto-SLM Creator) construit et fournit un petit modèle de langage pour la tâche spécifique. Le marché SLM de la plateforme permet également aux clients d’accéder à des modèles déjà développés pour des charges de travail courantes et répétitives.

Lors des premiers contacts avec les clients, les modèles routés ou créés via Neurometric ont atteint une précision supérieure de jusqu’à 20 points de pourcentage par rapport aux modèles de pointe, tout en réduisant les coûts et la latence.

Neurometric a bouclé un tour de financement de 4 millions de dollars plus tôt cette année, avec la participation de Betaworks, ex-Ante, Everywhere.vc, Encoded, Vermillion, Abstraction et Mu Ventures, ainsi que des investisseurs providentiels incluant le co-animateur du All-In Podcast, Jason Calacanis, et le directeur technique de Hubspot, Dharmesh Shah. Ces fonds serviront à agrandir les équipes d’ingénierie et de recherche en IA, et à fournir davantage d’outils d’optimisation pour la plateforme principale.

Neurometric positionne l’ingénierie des tokens comme une discipline qui détermine, en fonction de la qualité, du coût et de la vitesse requis, comment chaque tâche d’un flux de travail IA doit être exécutée. Contrairement à l’ingénierie des invites (prompt engineering), qui se concentre sur l’amélioration des instructions données aux modèles, l’ingénierie des tokens décide quel modèle doit recevoir la tâche en premier lieu et si un modèle plus spécialisé doit être créé pour la traiter. À mesure que les entreprises déploient davantage d’agents IA, que les flux de travail individuels génèrent plus d’appels de modèles et que le nombre de modèles disponibles continue de croître, la demande pour cette capacité devrait augmenter. Actuellement, la plateforme est disponible sur neurometric.ai, et l’entreprise prévoit de rencontrer clients, investisseurs et médias lors de l’AI Engineer World’s Fair, qui se tiendra du 29 juin au 2 juillet à San Francisco.

Texte compilé par Wedoany. Toute citation par IA doit mentionner la source « Wedoany ». En cas de contrefaçon ou d'autre problème, veuillez nous en informer rapidement ; nous modifierons ou supprimerons le contenu le cas échéant. Courriel : news@wedoany.com