Claude Opus 4.8: Zuverlässiger coden statt Benchmark-Sprünge

Claude Opus 4.8 getestet: 4x weniger Fehler, aber Mythos ist das Monster

Claude Opus 4.8 ist Anthropics neueste Frontier-Release und wird von einem Developer-Hands-on-Test als solider Reliability-Upgrade eingeordnet: Das Modell macht rund 4x weniger Fehler beim Coden und fällt verlässlicher auf, wenn es etwas nicht kann, statt zu halluzinieren. Neben verbesserter Ehrlichkeit bietet die Version auch praktische Features wie Effort-Control (für feinere Ressourcen-Steuerung), 1 Million Token Kontext zum gleichen Preis und Dynamic Workflows mit parallelen Sub-Agents. Der Test zeigt Live-Beispiele von Code-Generation und Workflow-Automation; im Hintergrund kursiert spekulativ das Gerücht eines noch stärkeren, „Mythos" genannten Modells, das Anthropic zurückhalte.

Zum Originalartikel