KI-Glossar ·Nlp

word2vec

Auch: Word Embeddings

word2vec (2013) ordnet Wörter als Vektoren so an, dass ähnliche Bedeutungen räumlich nah beieinanderliegen — der Vorläufer moderner Embeddings.

Die Idee

word2vec lernt aus riesigen Textmengen, welche Wörter in ähnlichen Zusammenhängen auftauchen. Wörter, die oft in gleicher Umgebung stehen ('Hund', 'Katze'), bekommen ähnliche Vektoren — Bedeutung wird zu Lage im Raum.

Das berühmte Beispiel

Weil Bedeutung zu Geometrie wird, lassen sich mit den Vektoren sogar Analogien rechnen: 'König − Mann + Frau' landet nahe bei 'Königin'. Das zeigte erstmals, dass ein Modell sprachliche Beziehungen erfasst.

Bedeutung

word2vec machte Embeddings populär und ebnete den Weg zu allem, was heute auf Vektoren beruht — von semantischer Suche bis zu den Eingaberepräsentationen großer Sprachmodelle.

Im Netz verbunden

setzt voraus
Im Wissensnetz ansehen