Claude Fable 5: Das neue Flagship-Modell und der umstrittene „Safety-Fallback" · KI-News

Claude Fable 5 ist Anthropics neustes Frontier-Modell und ersetzt die noch gefährlichere (unveröffentlichte) Version Mythos. Das Video deckt auf, dass Anthropic gezielt bestimmte Fähigkeiten eingebaut hat, die bei sensiblen Anfragen automatisch zu einer schwächeren Fallback-Version schalten – bei Cybersecurity, Biologie und auch KI-Entwicklungs-Support. Das löste Kritik von Sicherheitsforschern aus, die sich durch diese versteckte Sabotage bevormundet fühlen; Anthropic entschuldigte sich später. Das Modell erreicht 80,3 % auf SWE-Bench Pro und wird live im Video getestet, inklusive der Blockierung durch den Safety-Filter.

Zum Originalartikel