Frontier-Modelle · KI-News

Enterprise Opus 4.8, OpenRouter, Cognition: KI-Tokens als neue Währung

Das Token wird zur Rechnungseinheit: Anthropics Opus 4.8, bedeutende Fundraisings und eine Warnung des Papstes prägen die KI-Woche.

31.05.2026 · The Sequence

Benchmarks & Evals KI-Suchagenten "googeln" oft nur, was sie ohnehin schon wissen

Führende KI-Suchagenten recherchieren auf etablierten Benchmarks kaum wirklich – sie bestätigen mit Websuche vor allem ihr bereits vorhandenes Trainings-Wissen.

31.05.2026 · The Decoder (DE)

Agenten & Tool-Use Microsoft und Nvidia greifen an: KI-Agenten für Windows-PCs

Nvidia und Microsoft planen eine Allianz für Nvidia-basierte Windows-PCs mit lokal ausgeführten KI-Agenten – ein Neustart nach dem gescheiterten Copilot+-PC-Konzept.

30.05.2026 · The Decoder (DE)

Frontier-Modelle Das hilfreiche KI-Dilemma: Nützlicher Training macht Chatbots weniger menschlich

Eine Großstudie mit über 200.000 Teilnehmern zeigt einen paradoxen Effekt: Genau das Training, das Sprachmodelle zu guten Assistenten macht, verschlechtert ihre Fähigkeit, menschliches Verhalten vorherzusagen.

30.05.2026 · The Decoder (DE)

Frontier-Modelle Terence Tao: KI revolutioniert Mathematik durch Arbeitsteilung

Der Fields-Medalist Terence Tao sieht KI-gestützte Teamarbeit statt Einzelgenies als Zukunft der mathematischen Forschung.

30.05.2026 · The Decoder (DE)

Agenten & Tool-Use OpenAI bringt Computer Use für Codex auf Windows 11

OpenAIs Codex kann nun eigenständig Windows-Programme steuern, testen und debuggen – eine bedeutende Ausweitung der KI-Fähigkeiten auf lokale Desktops.

30.05.2026 · The Decoder (DE)

Agenten & Tool-Use Salesforce-Entwickler mit Claude Code: 79 Prozent mehr Produktivität – oder nur Marketing?

Salesforce hat seine gesamte Entwicklung auf Anthropics Claude Code umgestellt und berichtet von massiven Produktivitätsgewinnen – doch unabhängige Überprüfung bleibt aus.

30.05.2026 · The Decoder (DE)

Agenten & Tool-Use Anthropic stellt Claude Opus 4.8 vor – mit verbesserter Ehrlichkeit und Multi-Agent-Workflows

Anthropic bringt Claude Opus 4.8 mit gestärkter Selbstverifizierung und Multi-Agent-Fähigkeiten, während sich die Leistung Benchmarks OpenAIs GPT-5.5 annähert.

30.05.2026 · AI Daily Brief (YT)

Agenten & Tool-Use Claude Opus 4.8: Zuverlässiger coden statt Benchmark-Sprünge

Anthropics neues Flaggschiff-Modell Opus 4.8 glänzt vor allem durch höhere Zuverlässigkeit und Ehrlichkeit beim Code – ein Fokus auf praktische Verbesserungen statt Benchmark-Rekorde.

29.05.2026 · IchBinFabian (YT)

Frontier-Modelle OpenAI rüstet GPT-5.5 Instant auf und verabschiedet ältere Modelle

OpenAI verbessert GPT-5.5 Instant mit natürlicherer Sprachfähigkeit und integriert Schreib- und Code-Tools direkt ins Chat-Interface – ältere Modelle wie o3 und GPT-4.5 werden bis August 2026 abgeschaltet.

29.05.2026 · The Decoder (DE)

Frontier-Modelle Google behebt Bugs bei Gemini-Nutzungslimits

Google fixt mehrere Fehler, die das Videogenerierungs-Kontingent in Gemini zu schnell aufbrauchten – Ultra-Nutzer erhalten jetzt doppelte Limits.

29.05.2026 · The Decoder (DE)

Frontier-Modelle OpenAI startet Biodefense-Programm: GPT-Rosalind für Pandemievorsorge

OpenAI stellt sein spezialisiertes Biologie-Modell GPT-Rosalind kostenlos zur Pandemiebekämpfung und biologischen Gefahrenabwehr bereit – erste Partner sind renommierte Forschungsinstitute und globale Gesundheitsorganisationen.

29.05.2026 · The Decoder (DE)

Frontier-Modelle Claude Opus 4.8 im Detail: 15 versteckte Features und Capabilities

Anthropics neues Flaggschiff-Modell ist da – doch vieles in den 244 Seiten der System Card und den Benchmarks dürfte Nutzer überraschen.

29.05.2026 · AI Explained (YT)

Frontier-Modelle OpenAI startet Rosalind Biodefense – GPT für Biosicherheit und Pandemievorsorge

OpenAI erweitert den Zugang zu GPT-Rosalind für vetted Developer und US-Regierungspartner im Bereich Biosicherheit und Pandemievorsorge.

29.05.2026 · OpenAI Blog

Frontier-Modelle OpenAI veröffentlicht Leitfaden für unabhängige KI-Evaluationen

OpenAI gibt Richtlinien für externe Bewertungen von KI-Modellen ab – mit Fokus auf aussagekräftige Sicherheitstests bei Frontier-Systemen.

29.05.2026 · OpenAI Blog