MiniMax M3: Open-Weight-Modell mit einer Million Token Kontext und Coding-Fähigkeiten

MiniMax M3 bündelt Coding, 1M-Kontext und Multimodalität in einem offenen Modell

MiniMax hat ein neues Open-Weight-Modell namens M3 vorgestellt, das drei beeindruckende Fähigkeiten in einer Architektur bündelt: erstklassiges Code-Verständnis (auf dem Niveau proprietärer Top-Modelle), ein Kontextfenster von einer Million Tokens für lange Dokumentenverarbeitung, und native Multimodalität. Ein zentraler technischer Durchbruch ist eine neue Sparse-Attention-Technik, die den Rechenaufwand pro Token auf ein Zwanzigstel des Vorgängers senkt – ein enormer Effizienzgewinn. Die Modellgewichte sollen zeitnah auf Hugging Face verfügbar sein, was für die Open-Source-Gemeinschaft bedeutenden praktischen Wert hat.

Zum Originalartikel