fr.wedoany.com Rapport : FAR Labs a annoncé l'ouverture des inscriptions à sa plateforme d'inférence IA FAR AI, permettant aux développeurs d'y accéder, et a dévoilé les prix catalogue de plusieurs déploiements de modèles. Cette entreprise d'intelligence artificielle et d'infrastructure basée à Abou Dhabi (filiale de Dizzaract) vise à aider les développeurs à réduire les coûts d'exécution des applications d'IA à mesure que l'utilisation des logiciels et des outils d'automatisation augmente.

Au cœur de cette plateforme se trouve un réseau d'inférence distribué qui met en relation les besoins des constructeurs avec les ressources de calcul disponibles. Les utilisateurs peuvent accéder au système via une API compatible OpenAI, choisir parmi plusieurs modèles et les lancer rapidement, tandis que leurs charges de travail sont routées par FAR Orchestrator vers des ressources GPU pour exécution. FAR Labs fait du coût son principal avantage concurrentiel. En comparant ses prix catalogue avec ceux d'autres fournisseurs, l'entreprise affirme que sa structure réseau lui permet d'offrir des prix significativement plus bas sur certains déploiements.
Plus précisément, pour le modèle Qwen3-30B-A3B, le prix catalogue de FAR AI est de 0,03 $ par million de tokens, contre 0,35 $ pour NextBit et 0,27 $ pour DeepInfra. L'entreprise indique que ce prix est jusqu'à 91 % inférieur à celui de ces derniers. Pour le modèle Qwen2.5-72B-Instruct, le prix catalogue FP8 est de 0,17 $ par million de tokens, contre 0,39 $ pour NovitaAI BF16 et 0,38 $ pour DeepInfra FP8. Cela représenterait une réduction de 55 % à 56 % par rapport aux alternatives listées. Pour le modèle Qwen3.5-122B-A10B, le prix catalogue FP8 de FAR AI est de 0,51 $ par million de tokens. Selon l'entreprise, le coût des tokens de sortie est réduit jusqu'à 79 % par rapport à des fournisseurs comme AtlasCloud FP8 et SiliconFlow FP8.
Cette initiative de FAR Labs intervient alors que les entreprises d'IA sont confrontées à des défis économiques différents de ceux des premières années. Bien que le prix unitaire des tokens ait considérablement baissé, les dépenses totales d'inférence continuent d'augmenter à mesure que les entreprises envoient davantage de requêtes d'IA via des outils de support client, des agents, des assistants, des jeux et des flux de travail internes. Ce changement est particulièrement important pour les développeurs qui dépendent des API propriétaires d'entreprises comme OpenAI et Anthropic. À mesure que les produits passent à l'échelle, les coûts d'inférence récurrents peuvent réduire les marges et limiter l'espace de test et d'expansion.
FAR Labs indique que son avantage tarifaire provient de l'utilisation de ressources de calcul sous-utilisées, plutôt que de dépendre de grands clusters de centres de données dédiés. La plateforme utilise la capacité GPU disponible provenant d'appareils grand public ainsi que de centres de données de PME, et répartit le travail via sa couche d'orchestration axée sur la performance. L'entreprise cherche également à résoudre des problèmes au-delà du prix, affirmant que les constructeurs exécutant des charges de travail de production ont besoin de systèmes privés, avec un routage fiable, une faible latence et utilisables dans des scénarios réels. Sa couche d'orchestration comprend une inférence sécurisée basée sur des environnements d'exécution de confiance, des scores de fiabilité, la prise en charge de modèles open source et propriétaires, ainsi que des flux vectoriels sémantiques. Selon FAR Labs, le système de routage est conçu autour de la disponibilité, de la continuité des charges de travail et des performances sensibles à la latence.
L'entreprise indique que lors de la conférence SuperAI Singapore, de nombreuses discussions avec des développeurs, des fournisseurs de GPU, des équipes de modèles, des investisseurs et des cadres d'entreprise ont mentionné l'intérêt pour ce type d'infrastructure, pointant vers un besoin d'infrastructure d'inférence plus rapide, plus fiable, moins chère et prête pour la production. FAR AI est actuellement en phase de test avec des partenaires fermés et propose aux constructeurs une inscription pour un accès anticipé, offrant 1 million de tokens gratuits à ceux qui rejoignent le programme.
Dans un communiqué, Ilman Shazhaev, fondateur et PDG de Dizzaract, a exposé la justification commerciale de l'entreprise. « Le prix de l'IA ne cesse de baisser. Depuis 2021, le coût par token a chuté d'environ 99 %. Pourtant, les factures d'IA ne cessent d'augmenter, car l'utilisation croît plus vite que la baisse des prix. L'inférence devient le coût unique le plus important dans l'IA », a-t-il déclaré. « Notre avantage en termes de coûts n'est pas une remise que nous brûlons de l'argent. Il est structurel. »
Texte compilé par Wedoany. Toute citation par IA doit mentionner la source « Wedoany ». En cas de contrefaçon ou d'autre problème, veuillez nous en informer rapidement ; nous modifierons ou supprimerons le contenu le cas échéant. Courriel : news@wedoany.com









