Greedy Decoding ist die einfachste Erzeugungs-Strategie: in jedem Schritt immer das wahrscheinlichste nächste Token nehmen.
Wie es funktioniert
Nach jeder Vorhersage wählt das Modell ohne Umschweife das Token mit der höchsten Wahrscheinlichkeit und macht weiter. Keine Zufallskomponente, keine Alternativen — dieselbe Eingabe liefert stets dieselbe Ausgabe.
Stärke und Schwäche
Das ist schnell und reproduzierbar, gut für Aufgaben mit einer klar richtigen Antwort. Aber es kann sich in eintönige oder sich wiederholende Formulierungen verrennen, weil es nie einen kreativeren, lokal unwahrscheinlicheren Weg einschlägt.
Einordnung
Greedy ist der Spezialfall des Sampling bei Temperatur 0. Gründlicher, aber teurer ist die Beam Search, die mehrere Wege zugleich prüft.