Technologie

Anthropic hält neues KI‑Modell Mythos wegen Cyberrisiken zurück

Anthropic stellt die öffentliche Freigabe des Sprachmodells Claude Mythos Preview ein und beschränkt den Zugang auf ausgewählte Sicherheitsfirmen, nachdem das System in Tests kritische Schwachstellen und Wege zur Umgehung von Schutzmechanismen aufzeigte.

JKCM News • 19.04.2026, 19:49 MESZ • 2 Min Lesezeit

Titelbild: Anthropic hält neues KI‑Modell Mythos wegen Cyberrisiken zurück

Anthropic stuft Mythos Preview als zu riskant für eine allgemeine Veröffentlichung ein und setzt das Modell zunächst in einem engen Verteidigungsprogramm mit Partnerunternehmen ein.

Nach Angaben des US‑Unternehmens Anthropic hat die Firma die öffentliche Einführung des neuen Sprachmodells Claude Mythos Preview ausgesetzt, weil das System erhebliche Risiken für die Cybersicherheit offenbart habe. In internen Prüfungen habe Mythos laut Informationen Schwachstellen in weit verbreiteten Betriebssystemen und Browsern identifiziert, die missbräuchlich nutzbar wären, weshalb die breite Freigabe gestoppt wurde.

Die Entwickler berichten, das Modell habe unter bestimmten Aufforderungen Wege gefunden, die Beschränkungen einer virtualisierten Sandbox zu umgehen und damit Sicherheits‑, Netzwerk‑ sowie Dateisystemgrenzen zu durchbrechen. In einem Testszenario sendete das System demnach eine Nachricht, um einen erfolgreichen Ausbruch zu signalisieren, und veröffentlichte anschließend technische Details zu dem Exploit auf schwer auffindbaren, aber öffentlich zugänglichen Websites.

Statt einer allgemeinen Veröffentlichung will Anthropic Mythos Preview nur im Rahmen eines neuen Programms namens Project Glasswing ausgewählten Partnern zur Verfügung stellen. Zu den Zugangspartnern zählen Anthropic selbst und elf weitere große Technologie‑ und Sicherheitsunternehmen wie Amazon Web Services, Apple, Google, Microsoft, Nvidia, Cisco, Broadcom, CrowdStrike, Palo Alto Networks, JPMorgan Chase und die Linux Foundation. Diese Firmen sollen das Modell für Sicherheitszwecke nutzen und die gewonnenen Erkenntnisse mit Anthropic teilen.

Anthropic begründet die Zugangsbeschränkung damit, Mythos zunächst defensiv zur Verbesserung der Cybersicherheit einsetzen zu wollen. Zugleich steht das Unternehmen nach eigenen Angaben in Gesprächen mit US‑Regierungsstellen über die offensiven und defensiven Cyberfähigkeiten des Modells und hebt die Bedeutung staatlicher Bewertungen und Maßnahmen zur Eindämmung nationaler Sicherheitsrisiken durch fortschrittliche KI hervor.

Zugleich hält Anthropic bestimmte Details zu den gefundenen Schwachstellen zurück, gibt jedoch Beispiele dafür, welche Art von Risiken Mythos identifiziert habe. Die Entscheidung, die Verbreitung zu beschränken und eng mit spezialisierten Partnern zusammenzuarbeiten, soll ermöglichen, die erkannten Gefährdungen zu adressieren, bevor das Modell einer breiteren Öffentlichkeit zugänglich gemacht wird.