Google hat sein voriges Jahr experimental vorgestelltes Gemini-Diffusion-Modell nun als vollständig offenes 26-Milliarden-Parameter-Modell (DiffusionGemma-26B) veröffentlicht. Das unter Apache 2 lizenzierte Modell wird kostenlos von NVIDIA über deren NIM-Cloud-API gehostet und kann mit über 500 Token pro Sekunde arbeiten – deutlich schneller als typische LLMs. Damit öffnet Google fortgeschrittene Text-zu-Text-Generationstechnologie für die Community und sendet ein Signal, dass Diffusionsmodelle für NLP an Bedeutung gewinnen.