Überwachtes Lernen ist die Grundform des maschinellen Lernens, bei der ein Modell aus Beispielen mit bekannter richtiger Antwort (Labels) lernt.
Man zeigt dem Modell Paare aus Eingabe und gewünschter Ausgabe: dieses Foto → 'Katze', diese E-Mail → 'Spam'. Das Modell lernt die Abbildung dazwischen und kann sie dann auf neue, ungesehene Eingaben anwenden.
Klassifikation (eine Kategorie vorhersagen: Spam-Filter, Stimmungsanalyse) und Regression (eine Zahl vorhersagen: Hauspreis, Nachfrage). Die meisten produktiven ML-Anwendungen der letzten Jahrzehnte fallen in diese Klasse.
Gelabelte Daten sind teuer: Die richtigen Antworten müssen vorgegeben werden, oft von Menschen per Hand. Die Datenbeschaffung ist deshalb häufig aufwendiger als das Training selbst.
Das Gegenstück ist das Unüberwachte Lernen ohne Labels. Auch beim Zuschneiden von Sprachmodellen steckt überwachtes Lernen: Fine-Tuning und Instruction Tuning lernen aus Beispielpaaren.