Googles Gemma 4 12B: Multimodale KI für den Laptop

Googles Gemma 4 12B bringt multimodale KI mit Text, Bild und Audio auf handelsübliche Laptops
7/10 The Decoder (DE) 03.06.2026 Frontier-Modelle Multimodal Open Source Produkt-Launch

Google DeepMind hat Gemma 4 12B vorgestellt, ein neues Open-Source-Modell, das Text, Bilder und Audio nativ verarbeitet. Das besondere: Es läuft auf normalen Laptops mit nur 16 GB RAM – bei einer Leistung, die fast an das doppelt so große 26B-Modell heranreicht. Mit Apache-2.0-Lizenz ist auch kommerzielle Nutzung erlaubt. Das macht multimodale KI erstmals für Entwickler und Privatnutzer mit Standard-Hardware praktikabel.

Zum Originalartikel