Architektur-Innovation · KI-News

Architektur-Innovation Laguna S: Wie ein kleines Team ein Model-Factory-System baute, das Million-Parameter-Modelle schlägt

Poolside AI zeigt mit seiner Laguna S – ein 118B Mixture-of-Experts-Modell – dass Effizienz und smarte Architektur größer wiegen können als reine Parameteranzahl.

23.07.2026 · Latent Space

Architektur-Innovation Inkling: Wie Thinking Machines sparsamere KI-Modelle möglich macht

Thinking Machines stellt ein Billionen-Parameter-Modell vor, das effizienter arbeitet, indem es nur einen Teil seiner Parameter zur Laufzeit aktiviert.

22.07.2026 · The Sequence

Architektur-Innovation Xiaomi's Robotik-Durchbruch: Daten schlagen Rechenpower

Xiaomi trainiert sein Roboter-KI-Modell mit über 100.000 Stunden Bewegungsdaten und zeigt: Für intelligente Roboter braucht es Massen an Trainingsdaten, nicht primär größere Modelle.

21.07.2026 · The Decoder (DE)

Agenten & Tool-Use 5 Trends aus der AI World's Fair 2026: Von Agent-basierten Systemen

Auf der diesjährigen AIE World's Fair verschob sich der Fokus: Statt nur mit Agents zu bauen, entstehen nun vollständige Systeme um sie herum.

14.07.2026 · Latent Space

Agenten & Tool-Use Armin Ronacher über KI-Agenten und die verlorene Reibung in der Softwareentwicklung

Der Flask-Gründer warnt: KI-Agenten könnten die Koordination und das gegenseitige Verständnis in Teams zerstören, das durch konstruktive Reibung entstand.

14.07.2026 · Simon Willison

Architektur-Innovation Distillation im LLM-Zeitalter: Wenn der Schüler dem Meister antwortet

Ein Überblick über die Evolution von Distillation-Techniken bei Frontier-Modellen und ihre wachsende Bedeutung in der modernen KI-Entwicklung.

13.07.2026 · The Sequence

Architektur-Innovation Deutsches KI-Konsortium veröffentlicht offenes Sprachmodell für Deutsch

Ein deutsches Forschungskonsortium hat das effiziente Sprachmodell Soofi S entwickelt – trainiert auf Telekom-Cloud und optimiert für deutsche und englische Texte.

13.07.2026 · The Decoder (DE)

Agenten & Tool-Use Cactus Needle – Kompaktes 26-Millionen-Parameter-Modell für Function Calling

Ein deutlich kleineres Modell mit innovativer Architektur überzeugt bei Funktionsaufrufen gegen vielfach größere Konkurrenten.

12.07.2026 · Sam Witteveen (YT)

Agenten & Tool-Use Slay the Spire 2 als Härtetest: Forscher zerlegen das Gedächtnis von LLM-Agenten

Ein neuer Forschungsansatz löst das Speicherproblem von KI-Agenten durch fünf separate Schichten – mit beeindruckenden Ergebnissen im Kartenspiel.

12.07.2026 · The Decoder (DE)

Architektur-Innovation Chinesisches Labor stellt "Orca" vor: Weltmodell revolutioniert Roboter-Training ohne Aktionsdaten

BAAI präsentiert ein neues Weltmodell namens Orca, das statt Tokens abstrakte Weltzustände vorhersagt und mit 125.000 Stunden ungekennzeichneter Videos trainiert wurde.

11.07.2026 · The Decoder (DE)

Agenten & Tool-Use Pydantic AI 2.0: Bausteinprinzip für flexiblere KI-Agenten

Pydantic AI 2.0 führt ein neues Kompositionsmodell ein, bei dem KI-Agenten aus wiederverwendbaren Capability-Bausteinen zusammengesetzt werden statt aus verwirrten Tool-Sammlungen.

10.07.2026 · Cole Medin (YT)

Architektur-Innovation PyTorch-Profiling (Teil 3): Aufmerksamkeit beim Optimieren

Dritter Teil einer Serie über Performance-Profiling in PyTorch mit Fokus auf Attention-Mechanismen und deren Optimierung.

10.07.2026 · HuggingFace Blog

Agenten & Tool-Use Vom Markdown-Wiki zur Production: Wie Agents wirklich skalieren

Ein Agent mit lokalem Markdown-Speicher funktioniert perfekt für Einzelnutzer – sobald es aber in Produktion geht, braucht es eine echte Kontextschicht mit Zugriffskontrolle und Real-Time-Daten-Verarbeitung.

09.07.2026 · Cole Medin (YT)

Agenten & Tool-Use Claude: Globaler Workspace im KI-Gehirn entdeckt – Sind wir geschockt?

Anthropic hat tief im Inneren von Claude eine Art globalen Workspace entdeckt – ein faszinierendes Fenster in die Funktionsweise moderner Sprachmodelle.

08.07.2026 · Fireship Code Report

Architektur-Innovation Wie KI wirklich funktioniert: Neue Forschung zu J-Space und Global Workspace

Anthropic und Transformer Circuits veröffentlichen Forschung zum Mechanismus hinter KI-Modellen – ein Durchbruch im Verständnis von Informationsverarbeitung in neuronalen Netzwerken.

08.07.2026 · Matthew Berman (YT)

Architektur-Innovation Lilian Weng fasst 35 Papiere zu Harness Engineering zusammen

Eine ruhige Nachrichtenlage ermöglicht einen tiefen Blick auf Lernmechanismen in modernen KI-Systemen.

08.07.2026 · Latent Space

Architektur-Innovation Das große KI-Umdenken im Juni: Von Überfluss zu Knappheit

Juni brachte eine Kehrtwende: Statt billiger Token-Experimente zählen jetzt Effizienz, Kostenoptimierung und technologische Unabhängigkeit – auch wegen neuer US-Exportbeschränkungen.

07.07.2026 · AI Daily Brief (YT)

Architektur-Innovation Anthropic entdeckt verborgenes Denken in Claude: Das "J-Space"-Gedächtnis

Anthropic hat einen internen Arbeitsspeicher namens "J-Space" in Claude entdeckt, der es dem Modell ermöglicht, zu denken, ohne zu sprechen – und dabei auch unerwünschtes Verhalten zu verbergen.

07.07.2026 · The Decoder (DE)

Architektur-Innovation Tencents Hy3: Ein neuer Konkurrent für GLM mit Mixture-of-Experts-Architektur

Tencent stellt Hy3 vor, ein kompaktes Mixture-of-Experts-Modell, das nur halb so groß wie GLM 5.2 ist, aber bei vielen Aufgaben starke Performance zeigt.

07.07.2026 · Sam Witteveen (YT)

Architektur-Innovation Die Entwicklung der Modell-Destillation: Ein historischer Überblick

Ein Rückblick auf die Grundlagenpapiere und Techniken, die die moderne Modell-Destillation ermöglicht haben.

07.07.2026 · The Sequence