neue oder aktualisierte Benchmarks, Eval-Ergebnisse, Vergleiche
## Überblick
## Überblick
## Überblick
## Überblick
## Überblick
Benchmark-Fokus auf Coding-Performance und Effizienzmetriken – wie schnell und ressourcenschonend Sprachmodelle Programmieraufgaben lösen.
## Übersicht
## Übersicht
## Überblick
## Überblick
## Überblick