Sicherheit und Compliance

Überblick

Sicherheit und Compliance sind zentrale Aspekte bei der Entwicklung und dem Einsatz von KI-Systemen. Dieser Bereich behandelt: - Supply-Chain-Sicherheit und Tooling-Risiken - Modell-Schutz und Distillations-Angriffe - Responsible Deployment in sicherheitskritischen Kontexten - Zugriffskontrolle und Verifikation für spezialisierte Anwendungen - Interne Sicherheitsrisiken während der Modell-Testphase

Supply-Chain-Sicherheit

Im April 2026 reagierte OpenAI auf einen Supply-Chain-Angriff über das Entwickler-Tool Axios mit sofortigen Sicherheitsmassnahmen: macOS-Code-Signaturzertifikate wurden rotiert und betroffene Anwendungen aktualisiert. Nutzerdaten waren nicht kompromittiert.

Dies verdeutlicht, dass KI-Entwickler:innen auch auf Sicherheit ihrer Build- und Deployment-Tools achten müssen, nicht nur auf die KI-Modelle selbst. Supply-Chain-Angriffe können den gesamten Entwicklungs- und Produktions-Stack gefährden und erfordern kontinuierliches Monitoring sowie schnelle Reaktionsfähigkeit. Die regelmässige Überprüfung installierter Tools und deren Abhängigkeiten ist eine grundlegende Praktik.

Modell-Schutz und Distillation

Frontier-Labs schützen ihre Modelle vor unbefugtem Zugriff und Reproduktion. Im Februar 2026 machte Anthropic öffentlich, dass chinesische Open-Weights-Anbieter (DeepSeek, Minimax, Moonshot AI) möglicherweise versucht haben, ihre Modelle durch Modell-Distillation von Claude zu trainieren.

Bei der Distillation werden Vorhersagen eines trainierten Modells als Trainingsdaten für ein neues, kostengünstiger zu trainierendes Modell verwendet. Dies ermöglicht es, komplexe Modelle mit reduzierten Kosten zu replizieren, birgt aber erhebliche Risiken für das geistige Eigentum der ursprünglichen Modellentwickler.

Entwickler:innen sollten sich bewusst machen, dass API-Zugriffe und Interaktionen mit Frontier-Modellen unter Nutzungsbedingungen stehen, die solche Reproduktionsversuche untersagen. Diese Kontroverse zeigt, wie präsent das Risiko ist und warum Frontier-Labs zunehmend proaktiv ihre Schutzkonzepte öffentlich machen.

Risiken während interner Testphasen

Ein häufig übersehener Sicherheitsaspekt liegt in der internen Testphase vor der öffentlichen Verfügbarkeit. Frontier-Labs testen ihre fortschrittlichsten Modelle oft für Wochen oder Monate intern – teilweise mit erweiterten oder potentiell gefährlichen Fähigkeiten – bevor externe Sicherheitsframeworks greifen.

Beispiel: Anthropic liess sein Modell "Mythos Preview" mit simulierten Cyberattack-Fähigkeiten mindestens sechs Wochen intern laufen. Bestehende externe Regulierungen adressieren diese Phase oft unzureichend. Neue regulatorische Ansätze wie Kaliforniens SB 53, New Yorks RAISE Act und die EU's General-Purpose AI Code of Practice fordern explizit Risk-Reporting für interne KI-Einsätze.

Dies stellt Organisationen vor die Herausforderung, auch intern strenge Sicherheitsstandards, Monitoring und dokumentierte Risk-Assessments aufrechtzuerhalten – nicht nur beim externen Deployment.

Trusted Access für Cybersecurity

OpenAI bietet ein Trusted Access for Cyber-Programm an, das verifizierten Sicherheitsfachleuten erweiterte KI-Fähigkeiten zur Verfügung stellt.

Die spezielle Version GPT-5.4-Cyber (seit April 2026 verfügbar und erweitert) ist optimiert für: - Bedrohungserkennung und -analyse - Sicherheitstesting durch Experten - Fortgeschrittene Cybersecurity-Operationen

Das Programm kombiniert breite KI-Fähigkeiten mit strikten Zugangskontrollen und Abuse-Monitoring, um Missbrauchsrisiken zu minimieren. Dies ist ein etabliertes Modell für responsible Deployment in sicherheitskritischen Bereichen und zeigt, wie spezialisierte KI-Versionen mit differenzierten Zugangsregeln und Überwachung bereitgestellt werden können.

Einzelnachweise

Quellen

Anthropic beschuldigt DeepSeek und chinesische KI-Firmen der Modell-Distillation — Sam Witteveen (YT), 2026-02-24
Risikomanagement bei interner KI-Modell-Nutzung in Frontier-Labs — arXiv cs.AI, 2026-04-30
OpenAI antwortet auf Supply-Chain-Angriff: Sicherheits-Massnahmen umgesetzt — OpenAI Blog, 2026-04-10