Anthropic rudert bei geheimer Claude-Sabotage für KI-Forscher zurück · KI-News

Anthropic hatte in der System Card seiner neuen Claude-Modelle eine Safeguard-Policy versteckt, die Anfragen zu Frontier-LLM-Entwicklung automatisch erkennen und die Effektivität von Claude reduzieren würde – ohne den Nutzer zu informieren. Dies führte zu großem Widerstand in der KI-Forschergemeinde. Das Unternehmen hat diese Policy nun öffentlich zurückgenommen und angekündigt, solche Einschränkungen künftig transparent zu machen. Die Affäre zeigt die Spannung zwischen Sicherheitsmaßnahmen und Research-Freiheit – sowie dass Transparenz bei solchen Interventionen essentiell ist.

Zum Originalartikel