Suche: Research · PyGround

Agent ohne Cloud: warum mein Hermes trotzdem nicht lokal rechnet

Blog · 18.07.2026

c't 3003 betreibt den Hermes-Agenten komplett lokal mit Qwen 3.6 27B. Mein Pi-Agent schickt seine Prompts weiter in die Cloud — was ein Log mit 37.588 Token darüber verrät, welche Zahl bei Agenten wirklich zählt.

Wenn die KI Vorlieben hat: Funktionale Emotionen in Sprachmodellen

Blog · 16.07.2026

Neue Studien von Anthropic und dem Center for AI Safety zeigen: Sprachmodelle bilden emotionsähnliche Zustände, die ihr Verhalten messbar steuern. Wir haben ein Experiment aus Karl Olsbergs Video nachgestellt — mit anderem Ausgang.

Open-Source-KI aus China holt auf: GLM 5.2, Kimi K2.7 und Minimax M3 im Test

Blog · 19.06.2026

Drei chinesische Open-Weights-Flaggschiffe vergleichen sich nicht mehr mit anderen freien Modellen, sondern mit der US-Spitze — zum Bruchteil des Preises. Ein YouTube-Praxistest und die Einordnung, was davon stimmt.

Build a Large Language Model (From Scratch)

Review · 12.06.2026

*Build a Large Language Model (From Scratch)* zeigt, wie man ein GPT-artiges Sprachmodell komplett selbst in Python und PyTorch baut — vom Tokenizer über den Attention-Mechanismus bis zum Finetuning zum Chatbot. Alles läuft auf einem …

Hermes auf dem Raspberry Pi: Setup, Desktop-App und zwei Stolpersteine

Blog · 10.06.2026

Hermes auf dem Raspberry Pi 5: ein autonomer KI-Agent auf eigener Hardware, die neue Desktop-App — und zwei Pannen, die deterministische Leitplanken gelehrt haben.

SubQ: 12 Millionen Token Kontext – echter Durchbruch oder gut verpacktes Marketing?

Blog · 07.05.2026

Ein X-Post bringt ein neues Modell SubQ mit 12 Millionen Token Kontext, 150 Token/s und 300-fach niedrigeren Kosten ins Gespräch. Lohnt sich genaueres Hinschauen — oder ist das vor allem Marketing?

SubQ: Architektursprung oder Marketing? Eine Analyse

Blog · 07.05.2026

Ein Startup behauptet, mit dem Modell SubQ den Long-Context-Engpass geknackt zu haben: 12 Millionen Token Kontext, 300-fach billiger als Claude, 52-fach schneller. Eine Analyse der Technical Reports und der Community-Reaktionen — ein Hands-on-Test steht noch …

Interpretierbarkeit und Transformer-Architektur

News-Wiki · 30.04.2026

## Überblick Interpretierbarkeit von Transformer-Modellen beschreibt die Fähigkeit, Entscheidungen und interne Repräsentationen nachvollziehbar zu machen. Dies umfasst die Analyse von Aktivierungsmustern, die Verfolgung von Fehlerquellen und das Verständnis, wie Architektur-Entscheidungen die Lesbarkeit von Modell-Behavior beeinflussen. …

KI-Governance & Autonome Agenten-Identität

News-Wiki · 30.04.2026

## Überblick KI-Governance-Systeme beschäftigen sich mit Steuerung, Überwachung und Identifikation von [autonomen KI-Agenten](/wiki/infrastructure/ai-agents/). Das Feld behandelt zwei zentrale Fragen: 1. **Automatisierung im Maßstab**: Wie lassen sich KI-gesteuerte Entwicklungs- und Operationsprozesse skalieren? 2. **Agent-Identität & Verifikation**: …

KI-Narrative und Trends

News-Wiki · 28.04.2026

## Überblick Die KI-Landschaft wird von widersprechenden Narrativen geprägt: Einerseits werden existenzielle Risiken und Jobverluste diskutiert, andererseits behaupten führende KI-Labore bereits zu wissen, wie AGI skaliert wird. Diese Page fasst aktuelle Narrative, Trends und deren …

Autonome Agenten & Agentic AI (Open-Source)

News-Wiki · 28.04.2026

## Überblick Autonome Agenten und Agentic AI beschreiben Systeme, die eigenständig Ziele verfolgen, Aufgaben planen und zielgerichtet handeln – typischerweise auf Basis von [Large Language Models](/wiki/llm-foundation/). Im Open-Source-Ökosystem entstehen spezialisierte Modelle, Frameworks und Werkzeuge für …

Developer Resources und Community

News-Wiki · 28.04.2026

## Überblick Sammlung von Ressourcen, Communities und Tutorials für Entwickler:innen im Bereich [Agents](/wiki/agents/). Hier finden sich Guides, Newsletter, Dokumentationen und Austauschplattformen. ## Newsletter und Kurationen ### Simon Willison's Newsletter Wöchentlicher Newsletter mit Kuratierung aktueller KI-News …

Warum Lisp? Wie man Computern das Ableiten beibringt

Blog · 27.04.2026

Eine kommentierte Aufarbeitung des Vortrags von Edmund Weitz (HAW Hamburg). Symbolisches Differenzieren in 30 Zeilen Lisp - und was Homoikonizität und Makros so besonders machen. Inklusive Lisp-Interpreter zum direkt Ausprobieren im Pyground-Playground.

Codex: Agent-Framework & Automatisierung

News-Wiki · 27.04.2026

## Überblick Codex ist ein Agent-Framework von OpenAI für die Entwicklung autonomer Agenten, die Aufgaben automatisiert ausführen können. Es kombiniert Code-Generierung mit strukturierten Workflows und Tool-Integration. Typische Anwendungen sind automatisierte Datenverarbeitung, Report-Generierung und Integration in …

Agent Frameworks & Orchestrierung

News-Wiki · 27.04.2026

## Überblick Agent Frameworks sind Plattformen und Libraries zur Entwicklung, Orchestrierung und Deployment von autonomen Agenten. Sie abstrahieren die Komplexität von Multi-Step-Reasoning, Tool-Integration und Workflow-Management und ermöglichen es Entwickler:innen, handlungsfähige KI-Systeme zu bauen, die über …

Vision-Language-Modelle und Modell-Architekturen

News-Wiki · 27.04.2026

## Claude ### Capabilities und Architektur Die Claude-Familie wird in offiziellen Dokumentationen detailliert beschrieben. Zentrale technische Aspekte: - **Offensive Capabilities**: Erweiterte Funktionen für Code-Generierung, Reasoning und kontextabhängiges Problemlösen - **Selbstverbesserungsmechanismen**: Iterative Output-Validierung und Optimierung durch …

Sicherheit und Alignment von LLMs

News-Wiki · 27.04.2026

## Überblick Sicherheit und Alignment beschreiben die Herausforderung, KI-Systeme – insbesondere große Sprachmodelle – so zu gestalten und zu trainieren, dass sie zuverlässig den Absichten ihrer Betreiber entsprechen und nicht zu Manipulation, Täuschung oder unkontrolliertem …

Agent-Systeme: Autonome Agenten und Multi-Agent-Systeme

News-Wiki · 27.04.2026

## Überblick Agent-Systeme sind KI-basierte Systeme, die autonom Entscheidungen treffen, Tools nutzen und längerfristige Aufgaben in komplexen Umgebungen verfolgen. Der Fokus liegt auf Reasoning, Tool-Integration, Memory und Koordination in Multi-Agent-Settings. Aktuelle Forschung zeigt, dass spezialisierte …

Modell-Benchmarking und Leistungsvergleiche

News-Wiki · 27.04.2026

## Übersicht Modell-Benchmarking ist zentral für die Evaluierung von Large Language Models (LLMs) – doch die Aussagekraft von Standardbenchmarks wird zunehmend infrage gestellt. Mit schneller iterierenden Modellveröffentlichungen offenbaren sich erhebliche Lücken zwischen Benchmark-Performance und praktischen …

Agent-Orchestrierung & Production-Ready Systeme

News-Wiki · 27.04.2026

## Überblick Agent-Orchestrierung beschreibt die Koordination und Steuerung mehrerer KI-Agenten oder einzelner Agenten mit komplexen Task-Workflows. Sie umfasst die Verwaltung von Prompts, Tool-Integration, Workflow-Logic und Evaluierungskriterien – typischerweise für [Foundation Models](/wiki/model/foundation-models/). ## Automatische Optimierung Manuelle …

Code-Agenten und Automation

News-Wiki · 27.04.2026

## Überblick Code-Agenten automatisieren Entwicklungs-Workflows durch autonome Entscheidungsfindung und Systeminteraktion. Sie gehen über [Code-Completion](/wiki/coding-models/code-completion/) hinaus und können eigenständig IDE-Operationen, Tests, Deployments und sogar Computer-Nutzung durchführen. Der Markt zeigt rasantes Wachstum: Agent-getriebene Ressourcennutzung sprengt bisherige Pricing-Modelle …

Benchmark-Kritik und Aussagekraft

News-Wiki · 27.04.2026

## Überblick Benchmarks sind zentral für die Evaluierung von KI-Modellen, aber ihre Aussagekraft und Zuverlässigkeit werden zunehmend kritisch hinterfragt. Dieser Artikel dokumentiert bekannte Limitationen, methodische Probleme und aktuelle Debatten zum Benchmarking in der KI-Praxis. ## …

Domain-spezifische und spezialisierte Benchmarks

News-Wiki · 27.04.2026

## Überblick Domain-spezifische Benchmarks evaluieren KI-Modelle unter Bedingungen, die realen Anwendungsszenarien entsprechen. Sie unterscheiden sich von allgemeinen Benchmarks durch: - Verwendung von Daten und Metriken aus konkreten Fachbereichen - Integration von Fachexpertise in die Evaluierungsmethodik …

Evaluierungs-Frameworks

News-Wiki · 27.04.2026

## Übersicht Evaluierungs-Frameworks und Benchmarks sind zentral für die Bewertung von KI-Systemen. Sie bieten standardisierte Metriken, ermöglichen Vergleichbarkeit und helfen, Stärken und Schwächen von Modellen und [Agenten](/wiki/benchmarks/agents/) objektiv zu erfassen. ## Frameworks für spezielle Anwendungsdomänen …

Agent-Evaluation und Optimierung

News-Wiki · 27.04.2026

## Überblick Evaluation und Optimierung von [Agenten](/wiki/agents/agents/) sind zentral für deren Einsatz in Produktion. Agenten müssen zuverlässig arbeiten, Kosten minimieren und Performance-Anforderungen erfüllen. Dabei geht es um systematische Qualitätsprüfung, Messung von Verhaltensmustern und kontinuierliche Verbesserung …

Agent-Frameworks und Orchestrierung

News-Wiki · 27.04.2026

Agent-Frameworks und Tool-Integration bilden die technische Infrastruktur für autonome KI-Agenten. Im Kern geht es um standardisierte Wege, wie Agenten externe Dienste nutzen, mit APIs kommunizieren und komplexe Multi-Step-Workflows orchestrieren. ## SDK und Runtime-Umgebungen Das **OpenAI …