KI-Glossar ·Transformer

Positional Encoding

Auch: Positional Embeddings, Positionskodierung, RoPE

Positional Encoding gibt dem Transformer die Wortreihenfolge mit: Weil Attention alle Tokens gleichzeitig betrachtet, muss die Position jedes Tokens eigens kodiert werden.

Das Problem

Attention betrachtet alle Tokens auf einmal — sie ist von sich aus reihenfolge-blind. 'Hund beißt Mann' und 'Mann beißt Hund' enthielten ohne Positionsinformation dieselben Bausteine; der Unterschied ginge verloren.

Die Lösung

Jedes Token bekommt zusätzlich zu seiner Bedeutung eine Positionsinformation in sein Embedding gemischt. So weiß das Modell nicht nur, was ein Token ist, sondern auch, wo es steht — und kann Reihenfolge in seine Berechnungen einbeziehen.

Varianten

Die ursprünglichen Transformer nutzten feste Wellenmuster oder gelernte Positions-Embeddings. Moderne Modelle verwenden meist RoPE (Rotary Positional Embeddings): Die Vektoren werden positionsabhängig rotiert, was sich besonders für lange Kontexte bewährt hat.

Einordnung

Positional Encoding ist neben Attention und den Feedforward-Schichten der dritte Kernbaustein des Transformers — unscheinbar, aber ohne ihn kennt das Modell keine Wortreihenfolge.

Im Netz verbunden

ist Teil von

Transformer

setzt voraus

Embedding

Im Wissensnetz ansehen