KI-Glossar ·Grundlagen

Neuronales Netz

Auch: Neural Network, Künstliches Neuronales Netz, KNN, NN

Ein neuronales Netz ist ein lernfähiges Rechenmodell aus vielen einfachen, schichtweise verbundenen Recheneinheiten ('Neuronen'). Es lernt, indem es die Stärke seiner Verbindungen anhand von Beispieldaten anpasst — nicht nach fest programmierten Regeln.

Die Grundidee

Ein neuronales Netz ist lose dem Gehirn nachempfunden. Es besteht aus vielen Neuronen, die in Schichten angeordnet sind: eine Eingabeschicht nimmt die Daten auf, eine oder mehrere verborgene Schichten verarbeiten sie, eine Ausgabeschicht liefert das Ergebnis. Jedes Neuron empfängt Zahlen, verrechnet sie zu einem Wert und reicht ihn weiter.

Aufbau eines neuronalen Netzes: drei Eingabe-Neuronen, vier versteckte Neuronen, zwei Ausgabe-Neuronen, vollständig verbunden

Gewichte — das Gedächtnis des Netzes

Jede Verbindung trägt ein Gewicht: eine Zahl, die bestimmt, wie stark ein Signal weitergegeben wird. In diesen Gewichten steckt das gesamte Wissen des Netzes. Zu Beginn sind sie zufällig und das Netz rät nur; erst das Training stellt sie so ein, dass verlässliche Vorhersagen entstehen.

Der Lernvorgang

Man zeigt dem Netz viele Beispiele mit bekannter Lösung. Für jedes vergleicht es seine Ausgabe mit der richtigen Antwort, misst den Fehler und verschiebt alle Gewichte ein kleines Stück in die Richtung, die den Fehler verringert (Backpropagation). Millionenfach wiederholt, nähert es sich verlässlich guten Ergebnissen.

Leistungsfähigkeit

Weil das Netz seine Regeln selbst aus Daten ableitet, löst es Aufgaben, für die niemand Regeln von Hand aufschreiben könnte — Gesichter erkennen, Sprache übersetzen, Texte fortsetzen. Mehr Schichten ('tiefer') erlauben abstraktere Muster; das ist die Grundlage von Deep Learning.

Grenzen

Ein Netz ist nur so gut wie seine Trainingsdaten und braucht meist sehr viele davon. Und es ist eine Blackbox: dass es funktioniert, heißt nicht, dass man leicht erklären kann, warum es eine bestimmte Entscheidung trifft.

Im Netz verbunden

Beispiele / Arten

CNN RNN LSTM

besteht aus

Verborgene Schicht Perzeptron

setzt voraus

Perzeptron

Voraussetzung für

Verlustfunktion Aktivierungsfunktion Verborgene Schicht Deep Learning Transformer

nutzt

Aktivierungsfunktion

wird genutzt von

Monte-Carlo-Baumsuche

Im Wissensnetz ansehen