NVIDIA Nemotron 3 Ultra: 550B-Modell mit Agenten-Fokus

Nemotron 3 Ultra NVIDIA's 550B Open Model

NVIDIA hat Nemotron 3 Ultra vorgestellt, ein neues 550-Milliarden-Parameter-Modell mit nur 55 Milliarden aktiven Parametern (Mixture-of-Experts-Architektur). Das Modell wurde gezielt für die Entwicklung von KI-Agenten trainiert und nutzt Multi-Teacher-Distillation sowie spezialisiertes Post-Training mit Fokus auf Tool-Calling und Reasoning-Modi. Die Veröffentlichung als Open-Source-Modell auf Hugging Face stellt eine bedeutende Ressource für die breite KI-Community dar und positioniert NVIDIA als zentrale Kraft bei der Demokratisierung hochperformanter Modelle.

Zum Originalartikel