La faille découverte uniquement par l’IA (100%)

5 min. de lecture

Dans un consortium nommé Project Glasswing, un modèle d’IA a découvert au printemps des vulnérabilités que les auditeurs humains avaient manquées. Le même modèle, qui permet de combler ces failles, pourrait aussi les identifier pour les exploiter. Ce problème de Dual-Use contraint Anthropic à mettre en place des accès échelonnés et les équipes SOC à adopter un nouveau modèle de menace.

Les points clés en bref

La capacité est réelle. Les modèles Mythos d’Anthropic sont leaders dans les tâches de sécurité et identifient, dans des programmes comme Project Glasswing, des vulnérabilités que les humains manquent.
Défense et attaque reposent sur la même capacité. Qui trouve des failles de manière fiable peut aussi les exploiter. C’est précisément pour cette raison qu’Anthropic échelonne les accès et redirige les requêtes risquées vers un modèle moins puissant.
Le modèle de menace se transforme. Les équipes SOC doivent intégrer des attaquants qui recherchent des failles à la même vitesse que l’IA utilisée par la défense.

Articles connexes :Priorisation des correctifs : pourquoi le CVSS seul freine votre SOC / Sensibilisation à la sécurité : le taux de clic mesure le mauvais indicateur

Qu’est-ce que le Dual-Use dans les modèles d’IA ? Le Dual-Use désigne une capacité qui peut être exploitée à des fins défensives comme offensives. Un modèle d’IA capable de détecter des vulnérabilités pour les corriger peut utiliser cette même capacité pour les exploiter. C’est l’intention de l’utilisateur qui détermine l’issue.

Ce qui s’est passé au sein de Project Glasswing

Lorsqu’Anthropic a rendu publics ses modèles Mythos en avril, la première étape n’était pas un produit grand public. L’entreprise a conservé la version la plus puissante et l’a intégrée à un consortium : Project Glasswing. Là, des entreprises sélectionnées utilisent le modèle pour identifier et corriger des vulnérabilités logicielles avant qu’elles ne soient découvertes par des attaquants.

Les résultats ont justifié cette prudence. Un système capable de détecter des failles de sécurité plus rapidement et plus minutieusement qu’une équipe expérimentée constitue un outil de défense puissant. Un tel outil exige une diffusion contrôlée.

Le cœur du problème

Un modèle capable de détecter des vulnérabilités est aussi utile pour la défense que pour l’attaque. La méthode de recherche est identique, seul l’objectif diffère.

Pourquoi la même capacité agit dans les deux sens

Les tests d’intrusion et les attaques utilisent depuis toujours les mêmes techniques, mais avec des intentions différentes. Dans un modèle qui détecte des failles à grande échelle, cette vieille tension devient un problème concret de contrôle.

La réponse d’Anthropic repose sur l’échelonnement. La version largement accessible redirige automatiquement les requêtes à haut risque en cybersécurité, biologie et chimie vers un modèle moins performant, au lieu d’y répondre elle-même. La variante la plus puissante reste réservée à un cercle restreint de défenseurs et de fournisseurs d’infrastructures, parfois en collaboration avec des instances étatiques.

Avril 2026
Le modèle Mythos est rendu public, mais sa diffusion auprès du grand public est retardée. Lancement de Project Glasswing.

Printemps 2026
Le modèle identifie au sein du consortium des vulnérabilités qui avaient échappé aux vérificateurs humains.

Juin 2026
La variante la plus puissante est mise à disposition d’un cercle restreint de cyberdéfenseurs, tandis que la version grand public redirige les requêtes risquées.

La situation en chiffres

15+

Pays où les modèles Mythos sont testés sur des infrastructures critiques

80 %

du code fusionné par Anthropic proviendrait, selon ses dires, de Claude

niveaux d’accès séparent l’utilisation grand public de la pleine capacité de sécurité

Ce que cela signifie pour les équipes SOC

La conséquence pratique n’est pas une raison de paniquer, mais une incitation à se préparer. Si les défenseurs découvrent des failles à la vitesse de l’IA, les équipes de sécurité doivent partir du principe que les attaquants recherchent le même levier. La fenêtre temporelle entre la découverte d’une vulnérabilité et son exploitation tend à se réduire.

Pour votre propre modèle de menace, cela implique : des cycles de correctifs plus rapides, une surveillance plus étroite des interfaces exposées et l’hypothèse que la recherche automatisée deviendra la norme, des deux côtés. Les cadres de gouvernance comme NIS2 exigent déjà une réactivité démontrable. La recherche assistée par IA transforme cette obligation en une véritable question de rapidité.

Foire aux questions

Qu’est-ce que le dual-use dans les modèles d’IA ?

Le dual-use désigne une capacité qui peut être utilisée à la fois de manière défensive et offensive. Un modèle capable de détecter des vulnérabilités pour les corriger peut employer cette même capacité pour les exploiter. C’est l’intention de l’utilisateur qui détermine si cela cause un préjudice ou apporte un bénéfice.

Qu’est-ce que Project Glasswing ?

Un consortium dans lequel des entreprises sélectionnées utilisent le modèle Mythos d’Anthropic pour détecter et corriger des failles logicielles. Il s’agissait d’une approche délibérément contrôlée pour exploiter la puissante capacité de sécurité sans la rendre largement accessible.

Pourquoi le modèle grand public redirige-t-il les requêtes risquées ?

La version accessible au public transmet les sujets à haut risque en cybersécurité, biologie et chimie à un modèle moins performant. Cela permet d’offrir la pleine puissance là où elle est sans danger, et de la limiter là où un abus est possible.

Cela signifie-t-il plus d’attaques contre mon entreprise ?

Pas nécessairement plus, mais potentiellement plus rapides. Si la recherche automatisée devient la norme, la fenêtre entre la découverte et l’exploitation d’une faille se réduit. La rapidité des correctifs et la visibilité de vos interfaces deviennent cruciales.

Que doit faire concrètement une équipe SOC dès maintenant ?

Inventorier les interfaces exposées, fonder la priorisation des correctifs sur leur exploitabilité réelle plutôt que sur les seuls scores, et enrichir son modèle de menace avec des attaquants dotés de capacités d’IA. L’essentiel réside dans la rapidité de réaction d’une équipe.

Plus d’articles du réseau MBF Media

cloudmagazin

Pour le canal IT, l’IA n’est plus un terrain de jeu

mybusinessfuture

Quand la mise à jour devient elle-même une porte d’entrée

digital-chiefs

Golden Gate : Apple érige l’IA en fossé défensif

Source de l’image : générée par IA (juin 2026), certificat C2PA intégré à l’image

Imprimer l'article