Agentic Coding & Automation

Übersicht

Agentic Coding & Automation beschreibt Ansätze und Frameworks, bei denen KI-Agenten Softwareentwicklungsprozesse (von Planning über Code-Generierung bis Testing und Deployment) teilweise oder vollständig autonomisieren. Im Gegensatz zu traditionellen Code-Completion-Tools orchestrieren diese Systeme mehrere Schritte, verwalten Kontext über längere Zeiträume und integrieren sich in bestehende DevOps-Pipelines (GitHub, Slack, CI/CD).

Ein Kernmuster ist die Dark Factory: Ein vollständig autonomes System, das Issues triagiert, Code schreibt, testet, reviewed und merged – ohne menschliche Eingriffe. Parallel dazu haben sich Standards wie Harness Engineering (YAML-definierte KI-Workflow-Orchestrierung) und Agentic Engineering (strukturierte 3-Phasen-Prozesse) etabliert.

Frameworks & Orchestrierung

Archon

Archon ist ein Open-Source-Framework für Harness-basierte Workflow-Orchestrierung. Es kombiniert deterministische Skripte (Justfiles, Shell) mit KI-Agenten-Steps, bis Assertions erfüllt sind. Archon wird von der Community für die Dark Factory, Multi-Agent-Koordination und reproduzierbare Coding-Workflows verwendet.

Features: - YAML-basierte Harness-Definition - GitHub-Integration (Issue → PR-Merge) - Slack-Notifications - Model-Agnostik (unterstützt Claude, Kimi, Pi) - Web-UI und CLI - Pro-Node-Model-Selektion (verschiedene Modelle für verschiedene Task-Typen)

Anwendungen: - Parallele Entwicklung mit Git Worktrees - Setup & Maintenance Hooks für Codebases - Browser-Automation mit Playwright - Autonome PR-Pipelines

Pi – Lightweight Coding Agent

Pi ist ein Open-Source-Coding-Agent, konzipiert als bewusst einfache Alternative zu Claude Code. Das Design-Prinzip: minimaler Foundation-Core, austauschbare Extensions statt monolithischer Komplexität.

Philosophie: - Verzicht auf versteckte Subsysteme - Transparente Tool-Integration - Einfach zu modifizieren und zu debuggen - Gut geeignet für Custom-Agentic-Workflows mit Archon

Workstreams & Prozesse

Agentic Engineering (3-Phasen-Workflow)

Ein bewährter Prozess für Entwickler, die mit Coding-Agenten arbeiten:

  1. Planning: Ideen werden via Agent in strukturierte GitHub-Issues konvertiert. Task-Tracker halten den Überblick über Abhängigkeiten und Prioritäten.

  2. PIV Loop (Plan-Implement-Validate): Der Agent erhält fokussierte Tickets, arbeitet in isolierter Git-Umgebung (z.B. Worktrees) und validiert gegen Tests. Nachvollziehbare Kontextfenster, saubere Commits.

  3. System Evolution: Bugs und fehlgeschlagene Runs werden nicht nur gepatcht, sondern als Lernmaterial für KI-Layer-Verbesserungen genutzt (z.B. bessere Prompts, Validierungsregeln, Memory-Updates).

Der Ansatz ist bewusst leichtgewichtig und fungiert als Fundament, nicht als Ersatz für bestehende SDLC.

Dark Factory – Autonome Code-Pipeline

Die Dark Factory automatisiert den vollständigen Development-Workflow:

  • Issue-Triaging (automatisches Priorisieren und Labeling)
  • Code-Generierung (Agent schreibt Feature-Code)
  • Testing & Validation (Assertions checken)
  • Code-Review (Agent reviewt seinen eigenen Code gegen Style-Guides und Tests)
  • Merging (automatischer PR-Merge bei Validierung)

Status (April 2026): Multiple Instanzen berichten von stabilen, mehrwöchigen Läufen. Die erste produktive Anwendung (ein KI-Tutor) wurde fertiggestellt und deployed. Vergleichbare Implementierungen existieren bei Spotify und StrongDM.

Parallele Agentic Development mit Git Worktrees

Praktisches Setup für mehrere parallel laufende AI-Agenten:

  • Issue-Specs: Jeder Agent erhält ein detailliertes, isoliertes GitHub-Issue
  • Git Worktree pro Task: Verhindert Port-Konflikte und Abhängigkeitskollisionen
  • Planungsgetrennte Implementierungen: Agenten arbeiten auf verschiedenen Features unabhängig
  • Self-Healing-Layer: Dependency-Updates und Silent-Errors werden automatisch erkannt und korrigiert

Lessons Learned: Port-Konflikte, Datenbankmigrationen in parallelen Treads, stille Fehler bei Dependency-Resolution.

Tools & Patterns

Claude Code Multi-Agent-Orchestrierung

Mit Opus 4.6 wurde native Multi-Agent-Koordination eingeführt:

  • Spezialisierte Agenten: Parallele Task-Worker mit eigenem Kontext
  • Koordinations-Tools: TeamCreate, TaskCreate, SendMessage
  • Observability: Tool-Call-Tracking über 160+ Aufrufe
  • Sandboxing: E2B-Integration für sichere Code-Ausführung

Browser-Automation (4-Schichten-Stack)

Agentic Browser-Automation mit Claude Code und Playwright:

  1. Skills: Playwright CLI + Claude Code Integration
  2. Subagents: Spezialisierte, parallelisierbare Agenten
  3. Slash Commands: Orchestrierungs-Interface
  4. Task-Runner (Just): Wiederverwendbare Task-Definitionen

Agenten navigieren wie echte Nutzer, nutzen Screenshots statt fragiler Selektoren, können mehrere Browser-Sessions parallel handhaben.

Setup & Maintenance Hooks

Agentische Automatisierung von Codebase-Onboarding:

  • Setup Hooks: Deterministische Justfiles + Claude-Prompts für Installation, DB-Init, Dokumentation
  • Maintenance Hooks: Regelmäßige Health-Checks, automatische Dependency-Updates
  • Interaktive Flows: Von Agenten gesteuertes Onboarding ohne manuelle Tage-Prozesse

Wissensmanagement für Agenten

Claude Code + Obsidian

Strukturiertes Knowledge-Management:

  • Obsidian als zentrale Wissensbasis (Markdown-Vault)
  • Claude Code Hooks automatisieren Dokumentation und Verlinkung
  • CLAUDE.md als Onboarding-System (Agent lernt Codebase-Konventionen)
  • Kontinuierliches Wissens-Update über Agent-Sessions hinweg

Self-Learning Memory (Karpathy-inspiriert)

Agenten kompilieren Erkenntnisse aus Sessions in strukturierte Wiki-ähnliche Datenbanken:

  • Automatisierte Extraktion von Patterns, Bugs und Lösungen
  • Validierungsschicht gegen veraltete Einträge
  • Wachsende Wissensbasis für kürzere Future-Runs

AI-Second-Brain Template

Persönliches KI-Agent-System mit Memory:

  • Überwacht Emails, Kalender, Aufgaben (alle 30 Min)
  • Verfasst Antworten im persönlichen Stil
  • Slack-Integration für Mobile-Access
  • Memory-Layer + Daily-Reflection
  • Skill-System für Custom-Automation
  • Open-Source-Template verfügbar

Modell-Updates & Integration

Claude Code (OpenAI Codex Familie)

Aktuelle Features (April 2026): - Computer-Use für systemweite Automatisierung - In-App-Browser für Web-Recherche - Integrierte Bildgenerierung - Persistente Memory für Kontext-Erhalt über Sessions - Plugin-System für Custom-Extensions - Multi-Agent-Koordination mit Opus 4.6

Agents SDK (OpenAI)

Neue Version mit: - Natives Sandbox-Execution - Modell-native Harness-Layer - Erweiterte Tool-Definition - Längere, zuverlässigere Agent-Runs

Kimi K2.6 & MiniMax M2.7

Alternative Frontier-Modelle für agentic Workflows:

  • Kimi K2.6 (Chinese Frontier-Modell): Starke Code-Generierung, in Dark-Factory-Experimenten getestet
  • MiniMax M2.7: Leichtgewichtig, gut für ressourcenbeschränkte Deployments

Praktische Anwendungsfälle

App-Erstellung ohne Code (Replit Agent)

Der Replit KI-Agent verkürzt die Entwicklung von Idee zu Release auf ca. 15 Minuten:

  • Sprachbasierte Feature-Definition
  • Automatische Frontend + Backend-Generierung
  • Live-Testing auf mobilen Geräten
  • Publishing inklusive

Browser-Automatisierung & RPA

JARVIS-Template (Claude Code basiert):

  • Startet beim PC-Bootup automatisch
  • Interagiert mit Browser via Playwright
  • Webseiten-Analyse und Datenextraktion
  • Text-to-Speech-Output für Antworten
  • Computer-Use-Proof-of-Concept

Harness Engineering

Harness Engineering ist die Abstraktionsebene zwischen Raw-Prompting und Production-Automation:

Definition: YAML-definierte Systeme, die deterministische (Shell-Skripte, Tests) und KI-basierte Steps (Agent-Prompts) kombinieren, bis Success-Kriterien erfüllt sind.

Merkmale: - Versionskontrollierbar (Git-kompatibel) - Reproduzierbar und testbar - Loops, Approval-Gates, Fallbacks integriert - Multi-Model-Support (Pro-Node-Modell-Auswahl) - Integriert mit CI/CD (GitHub Actions, Slack)

Evolution: Repliziert bewährte Patterns aus Dark-Factory, Setup-Hooks und Multi-Agent-Workflows in ein standardisiertes Format.

Limits & Herausforderungen

  • Kontextfenster: Agenten benötigen strukturiertes Memory-Management für langfristige Konsistenz
  • Silent Failures: Parallele Datenbankaktion und Dependency-Resolution können unsichtbar scheitern – detaillierte Validation ist kritisch
  • Model-Consistency: Verschiedene Modelle (Claude, Kimi, Pi) verhalten sich unterschiedlich in agentic Workflows; Model-Selektion pro Task ist wichtig
  • Governance: Autonome Systeme benötigen Clear Approval-Gates und Audit-Logs für Compliance
  • Testing-Überblick: 160+ Tool-Calls pro Run erfordern gute Observability-Tools

Verwandte Topics

Quellen

Weitere Sub-Topics zu „Dev-Tools"