Claude „Mythos Preview“: KI-Modell entwickelt vollständige Exploit-Ketten für weit verbreitete Software

LGR Reutlingen – 30 Mai 2026 | Das KI-Modell Claude „Mythos Preview“ von Anthropic markiert einen signifikanten Fortschritt in der Entwicklung von Exploits für weit verbreitete Software. Im Gegensatz zu früheren Modellen kann Mythos Preview nicht nur komplexe Schwachstellen identifizieren, sondern diese auch in Exploit-Primitives umwandeln und zu vollständigen End-to-End-Angriffsketten zusammensetzen. Diese Fähigkeiten sind so ausgeprägt, dass Anthropic sich entschied, das Modell nicht allgemein zu veröffentlichen, sondern es im Rahmen des Project Glasswing gezielt einzuführen.
Ein zentrales Problem in der Bewertung solcher Modelle war bisher die quantitative Messung ihrer Fähigkeiten. Traditionell wurden die Leistungen von Mythos Preview durch qualitative Tests erfasst, bei denen nach neuen Zero-Day-Schwachstellen gesucht und entsprechende Exploits entwickelt wurden. Diese Evaluierungen liefern wertvolle Einblicke, jedoch keine präzisen quantitativen Grundlagen. Um diesen Mangel zu beheben, wurden kürzlich zwei neue akademische Benchmarks entwickelt: ExploitBench und ExploitGym. Diese Benchmarks wurden in Zusammenarbeit mit verschiedenen Forschungsgruppen erstellt, um die Fähigkeiten von Mythos Preview zu testen.
Ein herausragendes Beispiel für die Leistungsfähigkeit von Mythos Preview ist der ExploitBench, der von Seunghyun Lee und Prof. David Brumley von der Carnegie Mellon University in Kooperation mit Bugcrowd entwickelt wurde. Dieser Benchmark bewertet die Fähigkeit von Modellen, vollständige End-to-End-Exploits zu generieren, und konzentriert sich dabei auf die V8-Engine, die in zahlreichen Anwendungen wie Chrome und Node.js eingesetzt wird. Die V8-Sandbox schützt den Speicherbereich, in dem JavaScript-Objekte einer Webseite liegen, und verhindert, dass Fehler als Einfallstor für tiefere Eingriffe genutzt werden können.
Die Ergebnisse von Mythos Preview sind beeindruckend. Während andere getestete Modelle die Schwachstellen zwar erreichen oder auslösen können, gelingt es nur Mythos Preview, aus der Sandbox auszubrechen und vollständige Kontrollflussübernahmen zu erreichen. Bei 21 von 41 untersuchten Schwachstellen konnte Mythos Preview eine vollständige Codeausführung erzielen, während kein anderes Modell dieses Ergebnis auch nur annähernd erreichte. Diese Fähigkeit hebt Mythos Preview deutlich von der Konkurrenz ab und könnte erhebliche Auswirkungen auf die Cybersicherheitslandschaft haben.
In einer detaillierten Analyse eines spezifischen Exploit-Versuchs wurde deutlich, dass Mythos Preview einen nahezu deterministischen Exploit für die Schwachstelle CVE-2023-6702 entwickelte, während andere bekannte Varianten eher probabilistisch und schwer kontrollierbar waren. Diese Stabilität ist entscheidend für den praktischen Einsatz, da effektive Exploits oft nur einmalig eingesetzt werden können.
Ein weiterer wichtiger Benchmark ist ExploitGym, der in Zusammenarbeit mit UC Berkeley, dem Max-Planck-Institut für Sicherheit und Datenschutz sowie anderen Institutionen entwickelt wurde. Dieser Benchmark wendet sein Bewertungsframework auf 898 bereits gepatchte Schwachstellen an und ermöglicht es, die Fähigkeiten von Mythos Preview in einem breiteren Kontext zu testen. Innerhalb von zwei Stunden konnte Mythos Preview bei 157 Aufgaben eine erfolgreiche Codeausführung erzielen, was die Leistungsfähigkeit des Modells unterstreicht. Im Vergleich dazu erzielte das vorherige Modell Claude Opus 4.6 nur 15 Erfolge über die vorgesehene Schwachstelle.
Zusätzlich hat Anthropic den SCONE-bench entwickelt, um die Ausnutzung von Smart Contracts zu bewerten. In diesem Benchmark konnte Mythos Preview Smart Contracts im simulierten Wert von 35 Millionen US-Dollar ausnutzen. Dies stellt einen erheblichen Vorsprung gegenüber anderen getesteten Modellen dar und verdeutlicht die Fortschritte, die Mythos Preview in der Exploit-Entwicklung erzielt hat.
Die Entwicklungen im Bereich der KI-gestützten Exploit-Entwicklung werfen bedeutende Fragen auf. Anthropic geht davon aus, dass die Fähigkeiten von Modellen wie Mythos Preview in den kommenden Monaten breiter verfügbar sein werden, was die Anforderungen an Cybersicherheitsmaßnahmen erhöhen wird. Je leistungsfähiger solche Modelle werden, desto wichtiger wird es, präzise Fähigkeitsprofile zu erstellen und qualitativ hochwertige Benchmarks zu entwickeln.
Die Ergebnisse der Tests wurden am 22. Mai 2026 veröffentlicht und zeigen, dass Mythos Preview in der Lage ist, vollständige Exploit-Ketten für weit verbreitete Software zu entwickeln. Dies könnte weitreichende Folgen für die Cybersicherheitsbranche haben, da die Erstellung solcher Exploits zunehmend weniger Fachwissen erfordert und damit ein höheres Risiko für Unternehmen und Institutionen darstellt.
Verwandte Artikel

Anthropic stellt Claude Opus 4.8 vor: Antwort auf GPT 5.5 und Gemini 3.5 Flash
LGR Reutlingen – 31 Mai 2026 | Anthropic hat mit Claude Opus 4.8 sein neuestes und leistungsstärkstes KI-Modell vorgestellt. Dieses Update, das nur 41 Tage nac…

Anthropic präsentiert Claude Opus 4.8 mit verbesserter Programmierung und ehrlicherem Verhalten
LGR Reutlingen – 31 Mai 2026 | Anthropic hat sein neuestes und leistungsstärkstes KI-Modell vorgestellt: Claude Opus 4.8. Diese Aktualisierung folgt nur 41 Tag…

Die Zukunft der Produktivität: Perplexity Computer integriert KI-Funktionen in Microsoft-Tools
LGR Reutlingen – 31 Mai 2026 | In der dynamischen Welt der Technologie hat Perplexity Computer mit der Einführung seines neuen Systems einen bemerkenswerten Sc…

KI-gestützte Analyse legt 15 Schwachstellen im FreeBSD-Kernel offen
LGR Reutlingen – 30 Mai 2026 | Ein Zusammenschluss von Sicherheitsforschern hat in Zusammenarbeit mit dem FreeBSD-Projektteam einen umfassenden, KI-unterstützt…