MolmoMotion ist ein neues Forschungs-Projekt, das Sprachmodelle mit 3D-Bewegungsvorhersage verbindet. Das System kann aus natürlichsprachlichen Anweisungen präzise menschliche Bewegungsabläufe im dreidimensionalen Raum generieren und vorhersagen. Das Projekt zeigt, wie Multimodal-Modelle über Text hinaus auch physische Szenarien verstehen und modellieren können – relevant für Animation, Robotik und menschlich-ähnliche KI-Systeme. Die Arbeit demonstriert eine interessante Verbindung zwischen Language Understanding und Bewegungskomprehension.