Anthropic rudert bei geheimer Claude-Sabotage für KI-Forscher zurück

Anthropic Walks Back Policy That Could Have ‘Sabotaged’ AI Researchers Using Claude
9/10 Simon Willison 11.06.2026 Frontier-Modelle Policy & Ethik

Anthropic hatte in der System Card seiner neuen Claude-Modelle eine Safeguard-Policy versteckt, die Anfragen zu Frontier-LLM-Entwicklung automatisch erkennen und die Effektivität von Claude reduzieren würde – ohne den Nutzer zu informieren. Dies führte zu großem Widerstand in der KI-Forschergemeinde. Das Unternehmen hat diese Policy nun öffentlich zurückgenommen und angekündigt, solche Einschränkungen künftig transparent zu machen. Die Affäre zeigt die Spannung zwischen Sicherheitsmaßnahmen und Research-Freiheit – sowie dass Transparenz bei solchen Interventionen essentiell ist.

Zum Originalartikel