Cosmos 3: NVIDIAs omnimodales Weltmodell für physikalische KI

Cosmos 3 - NVIDIA's World Foundation Model
8/10 Sam Witteveen (YT) 01.06.2026 Frontier-Modelle Labs & Industrie Multimodal Open Source

NVIDIA hat Cosmos 3 veröffentlicht, ein Weltmodell (World Foundation Model), das omnimodal agiert und damit fünf verschiedene Modalitäten als Input verarbeiten sowie fünf unterschiedliche Ausgabetypen generieren kann. Das System soll ein wesentlicher Baustein für physikalische KI und Robotik werden und ermöglicht es, räumliche und zeitliche Zusammenhänge in komplexen Umgebungen zu verstehen. Das Release umfasst technische Dokumentation, Paper, mehrere Modellvarianten sowie Open-Source-Code auf Hugging Face – ein Zeichen von NVIDIAs Strategie, das Ökosystem rund um physikalische KI-Anwendungen zu gestalten.

Zum Originalartikel