Home Technologie et scienceIntelligence artificielle : Anthropic sort une version bridée de son modèle Mythos, adaptée au grand public

Intelligence artificielle : Anthropic sort une version bridée de son modèle Mythos, adaptée au grand public

by Thomas Caron
Une fuite de données révélant le projet Capybara

Anthropic a dévoilé le 7 avril 2026 Claude Mythos Preview, un modèle d’IA dont les capacités en cybersécurité sont jugées trop dangereuses pour un accès public. Ce modèle, révélé initialement par une fuite de données, est désormais réservé à une cinquantaine d’organisations partenaires via l’initiative Project Glasswing pour renforcer la cyberdéfense.

Une fuite de données révélant le projet Capybara

L’existence de ce modèle a été exposée prématurément en mars 2026. Une erreur de configuration dans le système de gestion de contenu d’Anthropic a rendu publics près de 3 000 documents, dont des brouillons de publications et des détails sur un sommet de PDG prévu en Europe. Selon un rapport de Fortune, ces documents mentionnaient un modèle nommé Claude Mythos, également désigné sous le nom de code Capybara. Capybara définit une nouvelle catégorie de modèles, se positionnant au-dessus de la gamme Opus, jusqu’alors la plus puissante de l’entreprise. Anthropic décrit ce saut technologique comme un changement d’échelle.

« Capybara » est le nom d’une nouvelle catégorie de modèle : plus grand et plus intelligent que nos modèles Opus — qui étaient, jusqu’à présent, les plus puissants.

Porte-parole d’Anthropic, via Fortune L’entreprise a rapidement corrigé la faille après avoir été alertée, précisant que les données confidentielles des clients n’avaient pas été compromises.

Des performances en codage et cybersécurité hors normes

Claude Mythos ne a pas été spécifiquement entraîné pour la sécurité informatique. Ses prouesses résultent de progrès généraux en raisonnement et en autonomie. Les tests internes montrent un écart significatif avec la version publique Claude Opus 4.6. Les données de performance, relayées par le Blog du Modérateur, illustrent cette domination technique :
Benchmark Claude Opus 4.6 Claude Mythos Preview
SWE-bench Verified (Ingénierie logicielle) 80,8 % 93,9 %
CyberGym (Reproduction de vulnérabilités) 66,6 % 83,1 %
Cybench (Capture The Flag) 100 %
Le score parfait atteint sur Cybench a conduit Anthropic à considérer ce test comme obsolète pour cette génération de modèles. L’IA a démontré sa capacité à identifier des failles critiques de manière autonome, sans guidage humain. Le modèle a notamment débusqué un bug vieux de 27 ans dans OpenBSD, un système réputé pour sa robustesse. Il a également repéré une vulnérabilité de 16 ans dans la bibliothèque multimédia FFmpeg, une ligne de code ignorée par les outils automatisés malgré cinq millions de passages. Enfin, Mythos a réussi à enchaîner plusieurs vulnérabilités du noyau Linux pour prendre le contrôle total d’une machine.

Project Glasswing : un accès restreint pour la cyberdéfense

Face aux risques, Anthropic refuse de rendre l’outil accessible au grand public. L’entreprise craint que des non-experts ne puissent utiliser Mythos pour exploiter des vulnérabilités sophistiquées. Pour encadrer cet outil, elle a lancé Project Glasswing le 7 avril 2026. D’après La Presse, environ 40 à 50 organisations partenaires, dont Google, Amazon et Apple, ont été sélectionnées. Ces partenaires de lancement utiliseront le modèle pour identifier les failles de leurs propres infrastructures avant que des acteurs malveillants ne les exploitent.

Nous développons un modèle généraliste avec des avancées significatives en raisonnement, en codage et en cybersécurité. Étant donné la force de ses capacités, nous sommes délibérés sur la manière dont nous le diffusons.

Project Glasswing : un accès restreint pour la cyberdéfense
Photo: blogdumoderateur.com

For more on this story, see Anthropic propose pause concertée mondiale IA.

Porte-parole d’Anthropic, via Fortune L’objectif est de préparer l’informatique à ce que l’entreprise appelle l’heure de vérité en cybersécurité.

Un tournant éthique et stratégique dans l’industrie

Un tournant éthique et stratégique dans l'industrie
Photo: lapresse.ca
Cette décision de brider l’accès à une IA jugée trop puissante marque une étape dans la stratégie d’Anthropic, qui a fait de l’éthique son image de marque. Début mars, la firme a notamment interdit au Pentagone d’utiliser son IA pour la conception d’armes autonomes ou la surveillance de masse. L’industrie a déjà connu des retards de lancement similaires. OpenAI avait repoussé la sortie de ChatGPT dès 2019 par crainte de la désinformation. De même, le PDG de Google a admis que Gemini avait été volontairement retardé en 2022 en raison de réponses jugées inconsistantes et dangereuses. L’impact sur le secteur est déjà tangible. Sylvestre Ledru, directeur de l’ingénierie chez Mozilla, a qualifié la réduction du temps et du coût de découverte des vulnérabilités de tournant historique après qu’Anthropic a identifié 112 bugs dans Firefox, dont 14 critiques. L’enjeu futur réside dans la démocratisation de ces capacités. Si Anthropic limite actuellement Mythos à un cercle restreint, la progression rapide de l’IA suggère que ces outils de détection et d’exploitation pourraient bientôt échapper au contrôle des acteurs engagés dans la cyberdéfense.

You may also like

Leave a Comment

This site uses Akismet to reduce spam. Learn how your comment data is processed.