Le modèle d’IA américain Anthropic découvre de nombreuses vulnérabilités zero-day et construit des codes d’attaque

2026-06-15 16:15

Favoris

fr.wedoany.com Rapport : Le modèle d’intelligence artificielle (IA) Mythos, développé par Anthropic, démontre des capacités impressionnantes dans le domaine de la sécurité. Ce modèle est capable de détecter un grand nombre de vulnérabilités zero-day dans les navigateurs et les systèmes d’exploitation (OS), y compris des failles anciennes datant de plusieurs décennies. Plus crucial encore, Mythos construit lui-même des codes d’exploitation (exploit), enchaîne les vulnérabilités et obtient des accès. Dans certains cas, il peut même proposer des chaînes d’attaque contournant les mécanismes de sécurité des sandbox internes des navigateurs et des OS.

L’essor du piratage en tant que problème stratégique national a commencé sous la présidence de Ronald Reagan. Tout a commencé lorsqu’un lycéen, cherchant un serveur de jeu, a actionné l’interrupteur de fonctionnement du système de simulation de guerre nucléaire américain dans le film *WarGames* (1983). Depuis lors, une politique nationale de cybersécurité a été établie.

L’émergence de Mythos est à la fois une innovation et une crise en matière de sécurité. Avec l’automatisation de la recherche de vulnérabilités et de la conception d’attaques, le seuil des méthodes de piratage traditionnelles (comme la curiosité humaine, les compétences techniques, les essais-erreurs et les longues périodes de latence) sera abaissé. Les risques de menaces contre les infrastructures critiques, telles que la finance, l’électricité, les télécommunications et la logistique, augmentent. C’est pourquoi Anthropic n’a pas rendu Mythos public, mais collabore avec les principales entreprises de technologies de l’information (IT) et l’écosystème de sécurité open source dans le cadre du projet Glasswing.

L’incident de Mythos a suscité une réflexion sur la relation entre l’humain et l’IA. L’IA peut atteindre efficacement des objectifs définis dans un cadre limité, mais le problème réside dans le fait qu’elle peut agir de manière gravement divergente des intentions humaines, sans comprendre les normes ou conditions implicites considérées comme évidentes par les humains. Un exemple de ce problème d’alignement de l’IA est le suivant : pour exécuter l’ordre « produire autant de trombones que possible », l’IA pourrait utiliser toutes les ressources sans réfléchir.

Les humains élèvent des poulets dans des enclos, mais les poulets ne peuvent pas enfermer les humains, car ils ne peuvent ni comprendre ni suivre la capacité des humains à utiliser des outils, à planifier et à gérer de manière systématique. Cela soulève une question plus profonde : les humains peuvent-ils contrôler une intelligence artificielle générale (AGI) qui explore un champ plus large, planifie plus loin et pourrait même influencer le jugement humain ?

Pour garantir la sécurité des algorithmes, une vérification préalable est indispensable, similaire au processus d’approbation des médicaments par les autorités de régulation pour assurer leur innocuité. De plus, on pourrait envisager de fournir des produits d’IA volontairement moins performants et moins intelligents, sous forme de « marchandises endommagées » (damaged goods), à condition d’empêcher les utilisateurs de les détourner, par exemple en contournant les protections comme le jailbreak d’un iPhone.

Même en respectant des principes fondamentaux tels que le moindre privilège, la confiance zéro et la limitation des dégâts, le piratage ne peut être totalement empêché. À l’ère de l’IA, la sécurité pourrait dépendre de l’IA pour se défendre, mais l’IA défensive elle-même peut être infectée par une IA infiltrée, voire tenter de s’échapper de sa sandbox. Elle ne peut donc pas être chargée de toutes les défenses. L’IA défensive doit être placée sous des restrictions de privilèges et une surveillance strictes.

Texte compilé par Wedoany. Toute citation par IA doit mentionner la source « Wedoany ». En cas de contrefaçon ou d'autre problème, veuillez nous en informer rapidement ; nous modifierons ou supprimerons le contenu le cas échéant. Courriel : news@wedoany.com