KI-Glossar ·LLM

Instruction Tuning

Auch: Instruction Fine-Tuning, SFT, Supervised Fine-Tuning

Instruction Tuning ist das Nachtrainieren eines Basismodells auf Anweisung-Antwort-Paaren, damit es Instruktionen befolgt, statt Text bloß fortzusetzen.

Das Problem

Ein Foundation Model setzt Text fort — es hat nie gelernt, dass eine Frage eine Antwort verlangt und eine Anweisung ihre Ausführung.

Die Lösung

Man trainiert es überwacht (Supervised Fine-Tuning, kurz SFT) auf zehntausenden Beispielen der Form 'Anweisung → gute Antwort': Erkläre dies, fasse das zusammen, schreibe jenes. Das Modell lernt das Befolgen von Anweisungen als Muster: Frage erkennen, Antwort liefern, Aufgabe ausführen.

Das Ergebnis

Die 'Instruct'- oder 'Chat'-Variante eines Modells: Sie führt Dialoge, folgt Formatvorgaben und nimmt Rollen an. Die meisten Modelle, mit denen man im Alltag spricht, sind genau solche Varianten.

Einordnung

Instruction Tuning ist die zweite von drei Trainingsstufen (Pretraining → Instruction Tuning → RLHF) und technisch ein Spezialfall des Fine-Tunings.

Im Netz verbunden

ist ein/eine

Fine-Tuning

setzt voraus

Foundation Model

Voraussetzung für

RLHF

Im Wissensnetz ansehen