KI-Glossar ·LLM

LLM

Auch: Large Language Model, Großes Sprachmodell, LLMs

Ein Large Language Model (LLM, deutsch: großes Sprachmodell) ist ein Sprachmodell mit sehr vielen Parametern, das seine Wahrscheinlichkeiten in einem rechenintensiven Training aus großen Textkorpora gelernt hat und sich durch seine Fähigkeit zur Textgenerierung auszeichnet.

Einordnung

Ein LLM ist ein computerlinguistisches Wahrscheinlichkeitsmodell: Es hat statistische Beziehungen zwischen Wörtern und Wortfolgen aus großen Textbeständen gelernt. LLMs gehören zum Deep Learning und zählen zur Generativen KI; technisch beruhen sie auf der Transformer-Architektur, meist als reiner Decoder.

Entstehung eines LLM

Drei Phasen: Datenerfassung (Textkorpora im Umfang von Billionen Tokens), Training (Pretraining: das Modell lernt, das jeweils nächste Token vorherzusagen, und justiert dabei Milliarden Parameter) und Feinabstimmung (Instruction Tuning und RLHF machen aus dem Basismodell einen Assistenten). Im Betrieb (Inferenz) bleiben die Parameter unverändert.

Fähigkeiten und Grenzen

Die Texterzeugung erfolgt Token für Token (Autoregression); dasselbe Modell übersetzt, fasst zusammen, beantwortet Fragen und schreibt Programmcode. Ein LLM verfügt jedoch über kein gesichertes Wissen — es erzeugt wahrscheinliche, nicht garantiert zutreffende Aussagen (Halluzination). Aktuelles oder internes Wissen wird zur Laufzeit ergänzt, üblicherweise über RAG. Bekannte LLM-Familien sind GPT (OpenAI), Claude (Anthropic), Gemini (Google) und Llama (Meta).

Im Netz verbunden

ist ein/eine

Sprachmodell Generative KI

Beispiele / Arten

Foundation Model GPT Claude

ist Teil von

Agent

setzt voraus

Transformer

Voraussetzung für

Stochastischer Papagei Benchmark Multimodal Mixture of Experts Prompt Halluzination Harness Agent Tool-Use Inferenz

nutzt

Autoregression

wird genutzt von

Guardrails

abzugrenzen von

Watson Cyc Harness

Im Wissensnetz ansehen