word2vec (2013) ordnet Wörter als Vektoren so an, dass ähnliche Bedeutungen räumlich nah beieinanderliegen — der Vorläufer moderner Embeddings.
Die Idee
word2vec lernt aus riesigen Textmengen, welche Wörter in ähnlichen Zusammenhängen auftauchen. Wörter, die oft in gleicher Umgebung stehen ('Hund', 'Katze'), bekommen ähnliche Vektoren — Bedeutung wird zu Lage im Raum.
Das berühmte Beispiel
Weil Bedeutung zu Geometrie wird, lassen sich mit den Vektoren sogar Analogien rechnen: 'König − Mann + Frau' landet nahe bei 'Königin'. Das zeigte erstmals, dass ein Modell sprachliche Beziehungen erfasst.
Bedeutung
word2vec machte Embeddings populär und ebnete den Weg zu allem, was heute auf Vektoren beruht — von semantischer Suche bis zu den Eingaberepräsentationen großer Sprachmodelle.