Mirage: Wie Video-KI räumliches Langzeitgedächtnis bekommt

Mirage zeigt, wie Video-KI ein räumliches Langzeitgedächtnis bekommt
6/10 The Decoder (DE) 14.06.2026 Architektur-Innovation Multimodal Research

Microsoft Research und mehrere Universitäten haben Mirage entwickelt, ein Video-Weltmodell, das Szeneninformationen direkt im latenten Raum statt in pixelbasierten Punktwolken speichert. Das neue Verfahren spart massiv Rechenzeit und Grafikspeicher, während die räumliche Konsistenz auch bei langen Kamerafahrten stabil bleibt. Das System kann bewegte Objekte allerdings noch nicht zuverlässig im Gedächtnis behalten – ein Hinweis auf das noch offene Potenzial dieser Architektur für realistische Videoverarbeitung.

Zum Originalartikel