Die folgende Sammlung gibt einen Überblick über wiederkehrende Themen rund um Künstliche Intelligenz — angefangen bei den Grundbegriffen bis hin zu praxisnahen Bausteinen für eigene Agenten.
Grundlagen
- Was ist ein LLM? Unterschied zwischen Token, Kontextfenster und Completion.
- Temperature, Top-p und wie Sampling die Antwort beeinflusst.
- System- vs. User- vs. Assistant-Rolle: wer darf was sagen?
- Cost & Latency: Input-/Output-Token-Preise, warum Streaming spürbar schneller wirkt.
Prompt-Engineering
- Zero-Shot, Few-Shot und warum Beispiele oft stärker wirken als Regeln.
- Chain-of-Thought — wann es hilft und wann es nur Tokens verbrennt.
- Strukturierte Ausgaben: JSON-Schemas, Tool-Calling, Pydantic-Validierung.
Agenten & Tool-Use
- Was ist ein Tool? Python-Funktion + JSON-Schema + Rückgabewert.
- Finite-State-Machine für Chat-Flows (Welcome, Fix-Bug, Explain-Content).
- Message-History vs. Sliding-Window vs. Vektor-Retrieval.
- Guardrails: Input-Filter, Rate-Limits, Kostendeckel pro Session.
RAG & Wissensspeicher
- Embeddings einfach erklärt (Kosinus-Ähnlichkeit, Dimensionen).
- Chunking-Strategien: fester Block vs. semantisches Splitting.
- Hybrid-Search: BM25 + Embeddings + Re-Ranking.
Praxis auf pyground
Der KI-Tutor rechts im Chat demonstriert mehrere dieser Konzepte live: er kennt den aktuellen Seiten-Slug (Context-Injection), reagiert auf ausgeführten Python-Code (Tool-Use via Telemetry) und wechselt den Persona-Tonfall über ein schlankes User-Profil.
Hinweis: Noch keine eigenen Artikel verlinkt — füge hier nach und nach Verweise auf deine Blog-Posts und Kursabschnitte ein.