Ein neuronales Netz ist ein lernfähiges Rechenmodell aus vielen einfachen, schichtweise verbundenen Recheneinheiten ('Neuronen'). Es lernt, indem es die Stärke seiner Verbindungen anhand von Beispieldaten anpasst — nicht nach fest programmierten Regeln.
Die Grundidee
Ein neuronales Netz ist lose dem Gehirn nachempfunden. Es besteht aus vielen Neuronen, die in Schichten angeordnet sind: eine Eingabeschicht nimmt die Daten auf, eine oder mehrere verborgene Schichten verarbeiten sie, eine Ausgabeschicht liefert das Ergebnis. Jedes Neuron empfängt Zahlen, verrechnet sie zu einem Wert und reicht ihn weiter.
Gewichte — das Gedächtnis des Netzes
Jede Verbindung trägt ein Gewicht: eine Zahl, die bestimmt, wie stark ein Signal weitergegeben wird. In diesen Gewichten steckt das gesamte Wissen des Netzes. Zu Beginn sind sie zufällig und das Netz rät nur; erst das Training macht aus dem Rauschen ein Können.
Wie ein Netz lernt
Man zeigt dem Netz viele Beispiele mit bekannter Lösung. Für jedes vergleicht es seine Ausgabe mit der richtigen Antwort, misst den Fehler und verschiebt alle Gewichte ein kleines Stück in die Richtung, die den Fehler verringert (Backpropagation). Millionenfach wiederholt, nähert es sich verlässlich guten Ergebnissen.
Warum das mächtig ist
Weil das Netz seine Regeln selbst aus Daten ableitet, löst es Aufgaben, für die niemand Regeln von Hand aufschreiben könnte — Gesichter erkennen, Sprache übersetzen, Texte fortsetzen. Mehr Schichten ('tiefer') erlauben abstraktere Muster; das ist die Grundlage von Deep Learning.
Grenzen
Ein Netz ist nur so gut wie seine Trainingsdaten und braucht meist sehr viele davon. Und es ist eine Blackbox: dass es funktioniert, heißt nicht, dass man leicht erklären kann, warum es eine bestimmte Entscheidung trifft.