25 Artikel
Frontier-Modelle Microsoft Research: Effizientes Text-zu-Bild-Modell mit deutlich weniger Parametern

Lens schlägt größere Konkurrenten mit einem Fünftel des Trainingsaufwands – Erfolgsgeheimnis sind hochwertige GPT-4-generierte Bildtexte statt vager Web-Daten.

08.06.2026 · The Decoder (DE)
Architektur-Innovation Warum große Sprachmodelle seltene Aufgaben lernen und kleine nicht

Eine neue Studie erklärt, warum kleine Sprachmodelle an seltenen Aufgaben scheitern: Häufige Tasks überschreiben das Gelernte – und wie man das ohne Modell-Vergrößerung lösen kann.

07.06.2026 · The Decoder (DE)
Frontier-Modelle KI verbessert sich selbst: Sakana AI öffnet Labor für rekursive Optimierung

Das japanische Start-up Sakana AI baut ein Forschungslabor für KI-Selbstverbesserung auf und positioniert sich damit als Alternative zum reinen Compute-Wettrüsten der US-Giganten.

06.06.2026 · The Decoder (DE)
Agenten & Tool-Use Thousand Token Wood: Multi-Agent-Ökonomie auf 3-Milliarden-Parameter-Modell

Ein Forschungsprojekt demonstriert, wie ein kompaktes 3B-Sprachmodell ein komplexes Multi-Agent-System mit eigener Ökonomie und emergenten Verhaltensweisen betreiben kann.

05.06.2026 · HuggingFace Blog
Agenten & Tool-Use Wie man schlechte Trainingsumgebungen vermeidet – ein Leitfaden für RL-Entwickler

Ein defektes Trainingssetup verschlechtert das Modell aktiv – ein erfahrener Entwickler teilt häufige Fehler und deren Lösungen.

05.06.2026 · Latent Space
Frontier-Modelle Microsoft trainiert KI-Modelle mit unlizenzierten Webdaten – trotz gegenteiliger Versprechen

Microsoft nutzt bei seinen MAI-Modellen entgegen früherer Zusagen unverschlüsselte Webdaten wie Common Crawl und beruft sich auf Fair Use – ein Verstoß gegen eigene Versprechungen.

05.06.2026 · The Decoder (DE)
Benchmarks & Evals VendingBench: Wie Frontier-Modelle wirklich evaluiert werden

Andon Labs zeigt, wie man robuste Benchmark-Suites für Claude und andere Frontier-Modelle von Grund auf entwickelt.

04.06.2026 · Latent Space
Agenten & Tool-Use Bain-Studie: Unternehmen scheitern bei KI-Kostenersparnissen

Eine Bain-Umfrage zeigt: Während Unternehmen 11-20 Prozent Kosteneinsparungen erhofften, erreichten fast 40 Prozent weniger als 10 Prozent – Grund ist die fehlende Automatisierung durch autonome KI-Agenten.

04.06.2026 · The Decoder (DE)
Agenten & Tool-Use EVA-Bench Data 2.0: Benchmark für KI-Agenten mit 121 Tools und 213 Szenarien

Neues Benchmark-Dataset für die Evaluierung von KI-Agenten über drei Domänen mit über 100 Tools und realistischen Szenarien.

04.06.2026 · HuggingFace Blog
Policy & Ethik Bioabwehr im Zeitalter der KI

Ein Aktionsplan für KI-gestützte biologische Widerstandsfähigkeit gegen Biosicherheitsrisiken.

04.06.2026 · OpenAI Blog
Architektur-Innovation Mit Axiom Math über Intuitive KI hinaus: Verifizierte Generierung im Fokus

Carina Hong präsentiert KI-Ansätze jenseits informaler Methoden mit Schwerpunkt auf verifizierten Outputs und iterativer Intelligenz.

03.06.2026 · Latent Space
Architektur-Innovation Direct Preference Optimization jenseits von Chatbots

Neue Forschung erweitert die DPO-Methode zur KI-Ausrichtung über Sprachmodelle hinaus auf andere Aufgaben und Modellklassen.

03.06.2026 · HuggingFace Blog
Architektur-Innovation Liquid Models: Die Suche nach einer Post-Transformer-Architektur

Eine Analyse einer der vielversprechendsten Alternativen zu Transformer-Architekturen.

02.06.2026 · The Sequence
Frontier-Modelle Turing-Preisträger Sutton: Generative KI ahmt nach, kann aber nicht wirklich entdecken

Richard Sutton kritisiert eine fundamentale Schwäche der heutigen generativen KI: Sie kann ihre eigenen Ergebnisse nicht bewerten und ist daher zu echter wissenschaftlicher Entdeckung unfähig.

01.06.2026 · The Decoder (DE)
Agenten & Tool-Use Warum Video-Agent-Modelle die Zukunft sind – Ein Interview mit Grok Imagines Architekt

xAI-Ingenieur Ethan He spricht über die Entwicklung von Grok Imagine, World Models und die kommende Generation von Video-Agenten.

01.06.2026 · Latent Space
Agenten & Tool-Use Große Gender-Lücke bei KI-Coding-Tools: Männer nutzen Agenten doppelt so häufig

Eine Anthropic-Studie zeigt: Forscher mit männlichen Namen verwenden Coding-Agenten wie Claude Code mehr als doppelt so oft wie Kolleginnen – auch bei gleicher Fachkompetenz.

31.05.2026 · The Decoder (DE)
Benchmarks & Evals KI-Suchagenten "googeln" oft nur, was sie ohnehin schon wissen

Führende KI-Suchagenten recherchieren auf etablierten Benchmarks kaum wirklich – sie bestätigen mit Websuche vor allem ihr bereits vorhandenes Trainings-Wissen.

31.05.2026 · The Decoder (DE)
Coding-Modelle Python-Apps direkt im Browser – mit Pyodide und Service Workers

Entwickler Simon Willison zeigt, wie man Python ASGI-Anwendungen vollständig im Browser via Pyodide und WebAssembly laufen lässt – mit Hilfe von Claude Opus als Coding-Partner.

30.05.2026 · Simon Willison
Frontier-Modelle Das hilfreiche KI-Dilemma: Nützlicher Training macht Chatbots weniger menschlich

Eine Großstudie mit über 200.000 Teilnehmern zeigt einen paradoxen Effekt: Genau das Training, das Sprachmodelle zu guten Assistenten macht, verschlechtert ihre Fähigkeit, menschliches Verhalten vorherzusagen.

30.05.2026 · The Decoder (DE)
Frontier-Modelle Terence Tao: KI revolutioniert Mathematik durch Arbeitsteilung

Der Fields-Medalist Terence Tao sieht KI-gestützte Teamarbeit statt Einzelgenies als Zukunft der mathematischen Forschung.

30.05.2026 · The Decoder (DE)