Klassifikation bezeichnet die Aufgabe, eine Eingabe einer von mehreren vordefinierten Kategorien zuzuordnen — etwa eine E-Mail als „Spam" oder „kein Spam". Sie ist eine Grundaufgabe des überwachten Lernens.
Bei der Klassifikation stehen die möglichen Antworten — die Klassen — vorab fest. Das Modell lernt aus Beispielen mit bekannter Klasse und ordnet danach neue, ungesehene Eingaben einer dieser Klassen zu. Gibt es nur zwei Klassen (ja/nein), spricht man von binärer Klassifikation, bei mehreren von Mehrklassen-Klassifikation.
Spam-Erkennung (Spam / kein Spam), Bilderkennung („Katze", „Hund", „Auto"), medizinische Befunde (gutartig / bösartig) oder Stimmungsanalyse von Texten (positiv / negativ / neutral). In all diesen Fällen ist die Ausgabe eine Kategorie, keine Zahl.
Klassifikation und Regression sind die zwei Grundaufgaben des überwachten Lernens. Der Unterschied liegt in der Ausgabe: Die Klassifikation liefert eine Kategorie, die Regression einen kontinuierlichen Zahlenwert.