Die Temperatur ist ein Regler bei der Texterzeugung: niedrig = vorhersehbar und fokussiert, hoch = kreativer und überraschender.
Was sie steuert
Bei jedem Schritt hat das Modell Wahrscheinlichkeiten für das nächste Token. Die Temperatur verändert, wie stark diese Verteilung 'zugespitzt' wird: Bei niedriger Temperatur dominiert die wahrscheinlichste Wahl, bei hoher kommen auch unwahrscheinlichere Tokens zum Zug.
In der Praxis
Für Fakten, Code oder strukturierte Ausgaben wählt man niedrige Temperatur (verlässlich, wiederholbar), für Brainstorming oder kreatives Schreiben höhere Werte. Sie wirkt mit dem Sampling zusammen — bei Temperatur 0 entsteht praktisch Greedy Decoding.