fr.wedoany.com Rapport : L'entreprise indienne de services de données SunTec India a achevé un projet d'annotation de données pour une société de conseil en infrastructures gouvernementales, traitant plus de 3 millions d'annotations avec un taux de précision de 99 %. Ce jeu de données sera utilisé pour entraîner un modèle de détection des actifs routiers et des dommages couvrant les réseaux routiers nationaux et d'État en Inde.
L'équipe d'annotation a utilisé des boîtes englobantes ainsi que des annotations à 4 points et à points multiples sur la plateforme CVAT hébergée par le client pour annoter des images routières, afin d'identifier les dommages de la chaussée et de classer les actifs routiers selon la norme gouvernementale IRC82. Le projet couvre plus de 1 000 kilomètres de corridors routiers, impliquant 71 catégories différentes de dommages et d'actifs. Parmi celles-ci, les annotations à 4 points représentaient environ 80 % du volume total, tandis que les 20 % restants nécessitaient des annotations à points multiples hautement détaillées.
Ce projet d'annotation d'images a débuté par un pilote à petite échelle avec 4 annotateurs et 1 vérificateur. Une fois le pilote terminé, la portée a rapidement été étendue, et l'équipe est passée à 35 annotateurs et 7 vérificateurs, tous des experts du domaine ayant une formation en génie civil. La précision est restée stable malgré une multiplication par huit de la taille de l'équipe. SunTec India attribue ce résultat à un ratio approprié entre vérificateurs et annotateurs, ainsi qu'à une formation systématique sur la norme IRC82 avant l'annotation des données réelles.
Rohit Bhateja, directeur des services d'ingénierie numérique et responsable marketing chez SunTec India, a déclaré que ce dont il est le plus fier est que la précision soit restée constante à mesure que l'échelle augmentait. Il a ajouté que les routes ne sont pas uniformes, avec des conditions météorologiques, d'éclairage et d'usure variables selon les régions, et qu'annoter 71 catégories sur une distance de mille kilomètres génère des milliers de cas limites. Atteindre une précision de 99 % dans ces conditions montre que le flux de travail homme-machine reste stable, quelle que soit la taille du jeu de données.
Cette étape importante consolide la position de SunTec India en tant que spécialiste de l'annotation de données dans les applications d'intelligence artificielle et d'apprentissage automatique, en particulier pour l'annotation d'images géospatiales et aériennes. Elle reflète également une demande croissante du marché pour des données d'entraînement en IA spécialisées, avec des directives techniques d'annotation et des catégories denses. L'entreprise prévoit une augmentation de la demande pour ce type d'annotations à haute cohérence dans les secteurs réglementés.
Fondée en 1999, SunTec India est une entreprise de services informatiques et numériques basée sur l'IA, fournissant des services de données intelligents et des plateformes technologiques d'IA pour la formation en IA, la recherche ESG, le renseignement commercial B2B et le traitement documentaire, ainsi que des opérations de gestion de données telles que la collecte, le nettoyage et l'enrichissement des données. Forte de plus de 25 ans d'expérience dans le secteur, l'entreprise a servi plus de 8 500 clients dans plus de 50 pays et emploie plus de 1 500 professionnels à temps plein.









