Kuratierte Ressourcen rund um KI, LLMs und Agenten

Die folgende Sammlung gibt einen Überblick über wiederkehrende Themen rund um Künstliche Intelligenz — angefangen bei den Grundbegriffen bis hin zu praxisnahen Bausteinen für eigene Agenten.

Grundlagen

  • Was ist ein LLM? Unterschied zwischen Token, Kontextfenster und Completion.
  • Temperature, Top-p und wie Sampling die Antwort beeinflusst.
  • System- vs. User- vs. Assistant-Rolle: wer darf was sagen?
  • Cost & Latency: Input-/Output-Token-Preise, warum Streaming spürbar schneller wirkt.

Prompt-Engineering

  • Zero-Shot, Few-Shot und warum Beispiele oft stärker wirken als Regeln.
  • Chain-of-Thought — wann es hilft und wann es nur Tokens verbrennt.
  • Strukturierte Ausgaben: JSON-Schemas, Tool-Calling, Pydantic-Validierung.

Agenten & Tool-Use

  • Was ist ein Tool? Python-Funktion + JSON-Schema + Rückgabewert.
  • Finite-State-Machine für Chat-Flows (Welcome, Fix-Bug, Explain-Content).
  • Message-History vs. Sliding-Window vs. Vektor-Retrieval.
  • Guardrails: Input-Filter, Rate-Limits, Kostendeckel pro Session.

RAG & Wissensspeicher

  • Embeddings einfach erklärt (Kosinus-Ähnlichkeit, Dimensionen).
  • Chunking-Strategien: fester Block vs. semantisches Splitting.
  • Hybrid-Search: BM25 + Embeddings + Re-Ranking.

Praxis auf pyground

Der KI-Tutor rechts im Chat demonstriert mehrere dieser Konzepte live: er kennt den aktuellen Seiten-Slug (Context-Injection), reagiert auf ausgeführten Python-Code (Tool-Use via Telemetry) und wechselt den Persona-Tonfall über ein schlankes User-Profil.

Hinweis: Noch keine eigenen Artikel verlinkt — füge hier nach und nach Verweise auf deine Blog-Posts und Kursabschnitte ein.