Regression bezeichnet die Aufgabe, aus einer Eingabe einen kontinuierlichen Zahlenwert vorherzusagen — etwa den Preis einer Immobilie aus Größe und Lage. Sie ist neben der Klassifikation die zweite Grundaufgabe des überwachten Lernens.
Bei der Regression ist die gesuchte Ausgabe eine Zahl auf einer fortlaufenden Skala, nicht eine feste Kategorie. Das Modell lernt aus Beispielen mit bekanntem Zielwert den Zusammenhang zwischen Eingaben und Ausgabe und schätzt daraus den Wert für neue Eingaben.
Der Immobilienpreis aus Wohnfläche, Lage und Baujahr; die morgige Temperatur aus Wetterdaten; der erwartete Umsatz aus Werbeausgaben. Die einfachste Form, die lineare Regression, beschreibt den Zusammenhang durch eine Gerade — sie zählt zu den ältesten statistischen Verfahren überhaupt.
Beide sind überwachte Aufgaben mit bekannten Zielwerten im Training. Die Regression sagt eine Größe voraus (wie viel?), die Klassifikation eine Kategorie (welche Art?).