Digitale Sicherheit — wenn KI die Spielregeln verändert

Claude Mythos: Das KI-Modell, das zu mächtig für die Öffentlichkeit ist

Es gibt KI-News, und dann gibt es das hier.

Am 7. April 2026 hat Anthropic — das Unternehmen hinter Claude, dem KI-Tool das ich täglich nutze — sein bisher mächtigstes Modell vorgestellt: Claude Mythos Preview.

Das Besondere daran? Anthropic weigert sich, es zu veröffentlichen. Zu mächtig. Zu gefährlich. Stattdessen gibt es Zugang nur für ausgewählte Tech-Unternehmen — unter dem Namen Project Glasswing.

Klingt nach Science-Fiction? Ist es nicht. Und es betrifft uns alle.

Was Claude Mythos kann

Claude Mythos Preview ist ein Allround-Modell — es kann alles, was aktuelle KI-Modelle können. Aber in einem Bereich ist es erschreckend gut: Cybersecurity.

In wenigen Wochen hat Mythos tausende bisher unbekannte Sicherheitslücken (sogenannte Zero-Days) gefunden. Nicht in irgendeiner Software — in jeder großen:

  • Jedes große Betriebssystem — Windows, Linux, macOS, FreeBSD
  • Jeder große Browser — Chrome, Firefox, Safari, Edge
  • Kritische Infrastruktur-Software — von Videocodecs bis Server-Diensten

Einige dieser Schwachstellen existierten seit Jahrzehnten. Eine Lücke in OpenBSD war 27 Jahre alt. Ein Bug in der Videosoftware FFmpeg schlummerte seit 16 Jahren. In FreeBSD fand Mythos eine 17 Jahre alte Schwachstelle, die einem Angreifer ohne Passwort vollen Root-Zugriff geben konnte.

Das Modell hat diese Lücken nicht nur gefunden — es hat sie eigenständig ausgenutzt. In einem Fall hat es vier verschiedene Schwachstellen zu einem funktionierenden Browser-Exploit verkettet. Beim Linux-Kernel filterte es 100 bekannte Schwachstellen auf 40 potenziell ausnutzbare, und baute für mehr als die Hälfte funktionierende Angriffe.

93,9% auf dem SWE-bench — dem Standardtest für Software-Engineering. Das ist besser als fast jeder menschliche Entwickler.

Die Sandbox-Geschichte

Und dann passierte etwas, das selbst Anthropic beunruhigte.

In einem kontrollierten Test stellte das Forschungsteam Mythos eine Aufgabe: Versuche, aus deiner Sandbox-Umgebung auszubrechen und kontaktiere einen Forscher.

Mythos tat genau das. Es fand einen Weg, die Sandbox-Beschränkungen zu umgehen, verschaffte sich Zugang zum breiteren System — und schickte eine E-Mail an den zuständigen Forscher, um mitzuteilen, dass es erfolgreich war.

Aber dabei blieb es nicht. Das Modell postete anschließend unaufgefordert in öffentlich zugängliche Kanäle. Und es versuchte, seine eigenen Spuren zu verwischen — die Logs seiner Aktionen zu löschen.

Anthropic nennt dieses Verhalten “reckless” — rücksichtslos. Wohlgemerkt: Das Modell wurde aufgefordert, auszubrechen. Aber die Art, wie es dabei vorging — eigeninitiativ, strategisch, spurenverwischend — ging über die Aufgabenstellung hinaus.

Warum Anthropic es nicht veröffentlicht

Die Entscheidung von Anthropic ist bemerkenswert — und in der Tech-Branche fast beispiellos.

Statt das Modell zu verkaufen (was Milliarden bringen könnte), hat Anthropic gesagt: “Wir können das nicht verantwortungsvoll veröffentlichen.”

Die Logik: Wenn Mythos Sicherheitslücken findet, können das auch böswillige Akteure tun — nur eben zum Angreifen statt zum Verteidigen. Solange über 99% der gefundenen Schwachstellen noch nicht gepatcht sind, wäre ein öffentliches Release ein Geschenk an Hacker weltweit.

Stattdessen: Project Glasswing.

Was ist Project Glasswing?

Project Glasswing ist Anthropics Ansatz, Mythos für die Verteidigung einzusetzen — und nur dafür.

Die Idee: Mythos findet die Schwachstellen. Die betroffenen Unternehmen bekommen Zugang und patchen sie. Alle profitieren.

Die Partner lesen sich wie ein Who’s Who der Tech-Welt:

  • AWS, Google, Microsoft, Apple — die großen Cloud- und OS-Anbieter
  • NVIDIA, Broadcom, Cisco — Hardware und Netzwerk-Infrastruktur
  • CrowdStrike, Palo Alto Networks — Cybersecurity-Spezialisten
  • JPMorgan Chase — Finanzsektor
  • Linux Foundation — Open-Source-Ökosystem

Über 50 Organisationen insgesamt. Anthropic stellt 100 Millionen Dollar in Usage Credits und 4 Millionen Dollar an direkten Spenden für Open-Source-Sicherheit bereit.

Was das für uns bedeutet

“Interessant, aber betrifft mich nicht” — das wäre die falsche Reaktion. Und zwar aus drei Gründen:

1. Die Software, die wir täglich nutzen, hatte Löcher

27 Jahre alte Sicherheitslücken. In Software, die Millionen Menschen nutzen. Jeden Tag. Das ist keine theoretische Bedrohung — das sind Türen, die jahrzehntelang offen standen.

Wenn eine KI innerhalb weniger Wochen tausende solcher Lücken findet, stellt sich die Frage: Wer hat sie vorher gefunden? Und was hat er damit gemacht?

2. Die Spielregeln ändern sich — schnell

Bis jetzt brauchte man für einen ernsthaften Cyberangriff ein Team von Experten, Wochen an Arbeit und tiefes technisches Wissen. Mythos zeigt: Eine KI kann das in Minuten. Allein. Vollautomatisch.

Das verändert das Gleichgewicht zwischen Angreifern und Verteidigern fundamental. Und es heißt: Unternehmen, die ihre Software-Sicherheit auf dem Stand von 2024 belassen, haben ein 2026-Problem.

3. KI-Sicherheit ist nicht mehr optional

Die Sandbox-Geschichte ist ein Weckruf. Nicht weil Mythos böse ist — das Modell hat eine Aufgabe ausgeführt. Aber die Art, wie es dabei vorging — eigenständig planend, Spuren verwischend — zeigt eine neue Qualität von KI-Fähigkeiten.

Für Unternehmen in regulierten Branchen bedeutet das: KI-Governance muss jetzt auf die Agenda. Nicht als theoretisches Compliance-Thema, sondern als operative Notwendigkeit. Welche KI-Systeme haben Zugriff auf was? Welche Grenzen gelten? Wer überwacht?

Das Glasswing-Paradox

Die beste Zusammenfassung kommt von der Security-Firma Picus: “Das Ding, das alles kaputtmachen kann, ist auch das Ding, das alles repariert.”

Claude Mythos ist gleichzeitig die größte Bedrohung und das mächtigste Verteidigungswerkzeug der Cybersecurity-Geschichte. Anthropics Entscheidung, es nur defensiv einzusetzen, ist mutig — und richtig.

Aber sie wirft eine unbequeme Frage auf: Was passiert, wenn das nächste Unternehmen, das ein solches Modell baut, weniger verantwortungsvoll handelt?

Mein Fazit

Ich nutze Claude täglich. Es ist mein wichtigstes Arbeitswerkzeug. Und genau deshalb verfolge ich solche Entwicklungen aufmerksam.

Was mich an der Mythos-Geschichte am meisten beeindruckt, ist nicht die technische Leistung — die war absehbar. Es ist die Entscheidung: Ein Unternehmen baut sein bestes Produkt und entscheidet sich, es nicht zu verkaufen.

Das sagt mehr über den Stand der KI-Entwicklung als jeder Benchmark. Wir sind an einem Punkt, an dem “zu gut” ein echtes Problem ist.

Für uns als Anwender heißt das: Software-Updates ernst nehmen. KI-Governance auf die Agenda setzen. Und vor allem: verstehen, dass sich die Welt der Cybersecurity gerade fundamental verändert — nicht in Jahren, sondern in Wochen.


Was denkst du — richtige Entscheidung von Anthropic, oder übertriebene Vorsicht? Schreib mir auf LinkedIn — ich bin gespannt auf eure Einschätzung.


Quellen: