Anthropic hat offiziell Mythos Preview vorgestellt, ein leistungsstarkes neues KI-Modell mit fortschrittlichen Cybersicherheitsfunktionen, zusammen mit einer riesigen branchenweiten Initiative namens Project Glasswing. In einem seltenen Schritt arbeitet das KI-Startup mit seinen Hauptkonkurrenten zusammen – darunter Google, Microsoft und Apple –, um sicherzustellen, dass die nächste Generation von KI-Tools als Schutzschild für die digitale Infrastruktur und nicht als Waffe für Hacker dient.
Der Aufstieg „zufälliger“ Cyber-Fähigkeiten
Die Entwicklung von Mythos Preview unterstreicht einen bedeutenden Trend in der künstlichen Intelligenz: Emergent Capabilities. Dario Amodei, CEO von Anthropic, bemerkte, dass das Modell nicht speziell für Hackerangriffe konzipiert sei; Vielmehr wurde es darauf trainiert, außerordentlich kompetent im Codieren zu sein.
Als direktes Nebenprodukt seiner Programmierfähigkeiten hat das Modell die Fähigkeit erlangt, komplexe Cybersicherheitsaufgaben auszuführen, wie zum Beispiel:
– Schwachstellenerkennung: Identifizieren von Schwachstellen in der Software.
– Exploit-Entwicklung: Erstellen von „Proofs of Concept“, um zu demonstrieren, wie ein System angegriffen werden kann.
– Penetrationstests: Simulieren von Angriffen zum Testen der Verteidigung.
– Binäranalyse: Evaluierung von Software, ohne Zugriff auf den Originalquellcode zu benötigen.
Dadurch entsteht ein „Katz-und-Maus“-Spiel mit hohen Einsätzen. Während diese Tools Verteidigern dabei helfen können, Fehler schneller zu finden und zu beheben, bieten sie Angreifern auch die Möglichkeit, ausgefeilte Angriffe zu automatisieren, deren Ausführung bisher zu schwierig oder zu teuer war.
Projekt Glasswing: Eine kollaborative Verteidigung
Anthropic hat das Risiko erkannt und das Project Glasswing gegründet, ein Konsortium, das das globale Technologie-Ökosystem auf eine Welt hochleistungsfähiger KI vorbereiten soll. Die Gruppe umfasst mehr als 40 Organisationen, von Technologiegiganten wie Nvidia und Amazon Web Services bis hin zu kritischen Infrastruktur- und Finanzinstituten.
Die Strategie hinter dieser Zusammenarbeit ist zweifach:
1. Schwachstellen mindern: Indem sie grundlegenden Plattformentwicklern (wie Microsoft und Google) privaten Zugriff auf Mythos Preview gewähren, können sie das Modell verwenden, um Schwachstellen in ihren eigenen Systemen zu finden und diese zu beheben, bevor das Modell für die breite Öffentlichkeit freigegeben wird.
2. Standardisierung der Verteidigung: Die Gruppe zielt darauf ab, Sicherheitsparadigmen neu zu definieren. Wie Logan Graham, Leiter des Frontier-Red-Teams von Anthropic, erklärte, könnten die aktuellen Sicherheitsannahmen innerhalb der nächsten 6 bis 24 Monate ins Wanken geraten, wenn diese Funktionen allgemein verfügbar werden.
„Wir haben gesehen, dass Mythos Preview Dinge erreicht hat, die ein erfahrener Sicherheitsforscher erreichen könnte“, sagt Graham. „Wenn dies nicht sorgfältig durchgeführt wird, könnte dies ein erheblicher Beschleuniger für Angreifer sein.“
Die „unauffindbaren“ Fehler finden
Die potenziellen Vorteile dieser Zusammenarbeit werden bereits erkannt. Anthropic berichtet, dass Mythos Preview bereits Tausende kritischer Schwachstellen aufgedeckt hat, darunter bestimmte Fehler, die in streng geprüftem Code jahrzehntelang unentdeckt geblieben waren.
Für Unternehmen wie Microsoft besteht das Ziel darin, KI zur Skalierung der Verteidigung einzusetzen. Igor Tsyganskiy, Global CISO von Microsoft, stellte fest, dass KI eine „beispiellose“ Möglichkeit bietet, Risiken auf globaler Ebene zu reduzieren, da die Cybersicherheit über die rein menschlichen Fähigkeiten hinausgeht.
Der Weg in die Zukunft
Das Projekt Glasswing befindet sich derzeit in einem frühen Stadium. Damit die Initiative erfolgreich ist, muss sie über einen kleinen Kreis von Technologieunternehmen hinausgehen und sich zu einem breiteren globalen Standard für die Verwaltung KI-gesteuerter Sicherheit entwickeln. Die zentrale Herausforderung besteht weiterhin darin, die kritischen Fragen der KI-Sicherheit zu identifizieren und Antworten zu finden, bevor die Technologie unsere Fähigkeit zur Abwehr übersteigt.
Schlussfolgerung
Durch die Zusammenführung von Wettbewerbern im Rahmen des Project Glasswing versucht Anthropic, eine potenzielle Sicherheitskrise in eine koordinierte Verteidigungsmaßnahme umzuwandeln. Das Ziel besteht darin, sicherzustellen, dass KI, je besser sie in der Lage ist, Software zu zerstören, auch in der Lage ist, diese zu schützen.
