Agentic Coding & Automation

Übersicht

Agentic Coding & Automation beschreibt Ansätze und Frameworks, bei denen KI-Agenten Softwareentwicklungsprozesse (von Planning über Code-Generierung bis Testing und Deployment) teilweise oder vollständig autonomisieren. Im Gegensatz zu traditionellen Code-Completion-Tools orchestrieren diese Systeme mehrere Schritte, verwalten Kontext über längere Zeiträume und integrieren sich in bestehende DevOps-Pipelines (GitHub, Slack, CI/CD).

Ein Kernmuster ist die Dark Factory: Ein vollständig autonomes System, das Issues triagiert, Code schreibt, testet, reviewed und merged – ohne menschliche Eingriffe. Parallel dazu haben sich Standards wie Harness Engineering (YAML-definierte KI-Workflow-Orchestrierung) und Agentic Engineering (strukturierte 3-Phasen-Prozesse) etabliert.

Frameworks & Orchestrierung

Archon

Archon ist ein Open-Source-Framework für Harness-basierte Workflow-Orchestrierung. Es kombiniert deterministische Skripte (Justfiles, Shell) mit KI-Agenten-Steps, bis Assertions erfüllt sind. Archon wird von der Community für die Dark Factory, Multi-Agent-Koordination und reproduzierbare Coding-Workflows verwendet.

Features: - YAML-basierte Harness-Definition - GitHub-Integration (Issue → PR-Merge) - Slack-Notifications - Model-Agnostik (unterstützt Claude, Kimi, Pi) - Web-UI und CLI - Pro-Node-Model-Selektion (verschiedene Modelle für verschiedene Task-Typen)

Anwendungen: - Parallele Entwicklung mit Git Worktrees - Setup & Maintenance Hooks für Codebases - Browser-Automation mit Playwright - Autonome PR-Pipelines

Pi – Lightweight Coding Agent

Pi ist ein Open-Source-Coding-Agent, konzipiert als bewusst einfache Alternative zu Claude Code. Das Design-Prinzip: minimaler Foundation-Core, austauschbare Extensions statt monolithischer Komplexität.

Philosophie: - Verzicht auf versteckte Subsysteme - Transparente Tool-Integration - Einfach zu modifizieren und zu debuggen - Gut geeignet für Custom-Agentic-Workflows mit Archon

Workstreams & Prozesse

Agentic Engineering (3-Phasen-Workflow)

Ein bewährter Prozess für Entwickler, die mit Coding-Agenten arbeiten:

Planning: Ideen werden via Agent in strukturierte GitHub-Issues konvertiert. Task-Tracker halten den Überblick über Abhängigkeiten und Prioritäten.
PIV Loop (Plan-Implement-Validate): Der Agent erhält fokussierte Tickets, arbeitet in isolierter Git-Umgebung (z.B. Worktrees) und validiert gegen Tests. Nachvollziehbare Kontextfenster, saubere Commits.
System Evolution: Bugs und fehlgeschlagene Runs werden nicht nur gepatcht, sondern als Lernmaterial für KI-Layer-Verbesserungen genutzt (z.B. bessere Prompts, Validierungsregeln, Memory-Updates).

Der Ansatz ist bewusst leichtgewichtig und fungiert als Fundament, nicht als Ersatz für bestehende SDLC.

Dark Factory – Autonome Code-Pipeline

Die Dark Factory automatisiert den vollständigen Development-Workflow:

Issue-Triaging (automatisches Priorisieren und Labeling)
Code-Generierung (Agent schreibt Feature-Code)
Testing & Validation (Assertions checken)
Code-Review (Agent reviewt seinen eigenen Code gegen Style-Guides und Tests)
Merging (automatischer PR-Merge bei Validierung)

Status (April 2026): Multiple Instanzen berichten von stabilen, mehrwöchigen Läufen. Die erste produktive Anwendung (ein KI-Tutor) wurde fertiggestellt und deployed. Vergleichbare Implementierungen existieren bei Spotify und StrongDM.

Parallele Agentic Development mit Git Worktrees

Praktisches Setup für mehrere parallel laufende AI-Agenten:

Issue-Specs: Jeder Agent erhält ein detailliertes, isoliertes GitHub-Issue
Git Worktree pro Task: Verhindert Port-Konflikte und Abhängigkeitskollisionen
Planungsgetrennte Implementierungen: Agenten arbeiten auf verschiedenen Features unabhängig
Self-Healing-Layer: Dependency-Updates und Silent-Errors werden automatisch erkannt und korrigiert

Lessons Learned: Port-Konflikte, Datenbankmigrationen in parallelen Treads, stille Fehler bei Dependency-Resolution.

Tools & Patterns

Claude Code Multi-Agent-Orchestrierung

Mit Opus 4.6 wurde native Multi-Agent-Koordination eingeführt:

Spezialisierte Agenten: Parallele Task-Worker mit eigenem Kontext
Koordinations-Tools: TeamCreate, TaskCreate, SendMessage
Observability: Tool-Call-Tracking über 160+ Aufrufe
Sandboxing: E2B-Integration für sichere Code-Ausführung

Browser-Automation (4-Schichten-Stack)

Agentic Browser-Automation mit Claude Code und Playwright:

Skills: Playwright CLI + Claude Code Integration
Subagents: Spezialisierte, parallelisierbare Agenten
Slash Commands: Orchestrierungs-Interface
Task-Runner (Just): Wiederverwendbare Task-Definitionen

Agenten navigieren wie echte Nutzer, nutzen Screenshots statt fragiler Selektoren, können mehrere Browser-Sessions parallel handhaben.

Setup & Maintenance Hooks

Agentische Automatisierung von Codebase-Onboarding:

Setup Hooks: Deterministische Justfiles + Claude-Prompts für Installation, DB-Init, Dokumentation
Maintenance Hooks: Regelmäßige Health-Checks, automatische Dependency-Updates
Interaktive Flows: Von Agenten gesteuertes Onboarding ohne manuelle Tage-Prozesse

Wissensmanagement für Agenten

Claude Code + Obsidian

Strukturiertes Knowledge-Management:

Obsidian als zentrale Wissensbasis (Markdown-Vault)
Claude Code Hooks automatisieren Dokumentation und Verlinkung
CLAUDE.md als Onboarding-System (Agent lernt Codebase-Konventionen)
Kontinuierliches Wissens-Update über Agent-Sessions hinweg

Self-Learning Memory (Karpathy-inspiriert)

Agenten kompilieren Erkenntnisse aus Sessions in strukturierte Wiki-ähnliche Datenbanken:

Automatisierte Extraktion von Patterns, Bugs und Lösungen
Validierungsschicht gegen veraltete Einträge
Wachsende Wissensbasis für kürzere Future-Runs

AI-Second-Brain Template

Persönliches KI-Agent-System mit Memory:

Überwacht Emails, Kalender, Aufgaben (alle 30 Min)
Verfasst Antworten im persönlichen Stil
Slack-Integration für Mobile-Access
Memory-Layer + Daily-Reflection
Skill-System für Custom-Automation
Open-Source-Template verfügbar

Modell-Updates & Integration

Claude Code (OpenAI Codex Familie)

Aktuelle Features (April 2026): - Computer-Use für systemweite Automatisierung - In-App-Browser für Web-Recherche - Integrierte Bildgenerierung - Persistente Memory für Kontext-Erhalt über Sessions - Plugin-System für Custom-Extensions - Multi-Agent-Koordination mit Opus 4.6

Agents SDK (OpenAI)

Neue Version mit: - Natives Sandbox-Execution - Modell-native Harness-Layer - Erweiterte Tool-Definition - Längere, zuverlässigere Agent-Runs

Kimi K2.6 & MiniMax M2.7

Alternative Frontier-Modelle für agentic Workflows:

Kimi K2.6 (Chinese Frontier-Modell): Starke Code-Generierung, in Dark-Factory-Experimenten getestet
MiniMax M2.7: Leichtgewichtig, gut für ressourcenbeschränkte Deployments

Praktische Anwendungsfälle

App-Erstellung ohne Code (Replit Agent)

Der Replit KI-Agent verkürzt die Entwicklung von Idee zu Release auf ca. 15 Minuten:

Sprachbasierte Feature-Definition
Automatische Frontend + Backend-Generierung
Live-Testing auf mobilen Geräten
Publishing inklusive

Browser-Automatisierung & RPA

JARVIS-Template (Claude Code basiert):

Startet beim PC-Bootup automatisch
Interagiert mit Browser via Playwright
Webseiten-Analyse und Datenextraktion
Text-to-Speech-Output für Antworten
Computer-Use-Proof-of-Concept

Harness Engineering

Harness Engineering ist die Abstraktionsebene zwischen Raw-Prompting und Production-Automation:

Definition: YAML-definierte Systeme, die deterministische (Shell-Skripte, Tests) und KI-basierte Steps (Agent-Prompts) kombinieren, bis Success-Kriterien erfüllt sind.

Merkmale: - Versionskontrollierbar (Git-kompatibel) - Reproduzierbar und testbar - Loops, Approval-Gates, Fallbacks integriert - Multi-Model-Support (Pro-Node-Modell-Auswahl) - Integriert mit CI/CD (GitHub Actions, Slack)

Evolution: Repliziert bewährte Patterns aus Dark-Factory, Setup-Hooks und Multi-Agent-Workflows in ein standardisiertes Format.

Limits & Herausforderungen

Kontextfenster: Agenten benötigen strukturiertes Memory-Management für langfristige Konsistenz
Silent Failures: Parallele Datenbankaktion und Dependency-Resolution können unsichtbar scheitern – detaillierte Validation ist kritisch
Model-Consistency: Verschiedene Modelle (Claude, Kimi, Pi) verhalten sich unterschiedlich in agentic Workflows; Model-Selektion pro Task ist wichtig
Governance: Autonome Systeme benötigen Clear Approval-Gates und Audit-Logs für Compliance
Testing-Überblick: 160+ Tool-Calls pro Run erfordern gute Observability-Tools

Quellen

AI Dark Factory: Selbstschreibender Code in der Praxis — Cole Medin (YT), 2026-04-16
Parallele Claude Code Agenten mit Git Worktrees: Workflow für produktives AI-Coding — Cole Medin (YT), 2026-04-23
Claude Code Setup Hook: Agentische Automatisierung von Codebase-Onboarding und -Wartung — IndyDevDan (YT), 2026-01-26
4-Schichten-Stack für Agentic Browser Automation mit Claude Code und Playwright CLI — IndyDevDan (YT), 2026-02-16
Anleitung: Eigenes KI-Second-Brain mit Claude Code bauen — Cole Medin (YT), 2026-04-02
Agentic Engineering: Drei-Phasen-Workflow für zuverlässige KI-gestützte Entwicklung — Cole Medin (YT), 2026-04-30
Harness Engineering: Die nächste Stufe der KI-gestützten Code-Generierung — Cole Medin (YT), 2026-04-09
Pi Coding Agent + Archon: Flexible KI-Coding-Workflows ohne Ballast — Cole Medin (YT), 2026-04-20
Dark Factory mit Kimi K2.6: Live-Automatisierung von Code-Generierung und PR-Management — Cole Medin (YT), 2026-04-25
Die nächste Generation des Agents SDK — OpenAI Blog, 2026-04-15
Codex für (fast) alles – Update mit Computer-Use und erweiterten Features — OpenAI Blog, 2026-04-16
Claude Code Multi-Agent-Orchestrierung mit Opus 4.6 und Tmux — IndyDevDan (YT), 2026-02-09
AI-Zweithirn mit Multi-Agent-Coding-Workflows: Live-Demo mit Archon — Cole Medin (YT), 2026-04-02
Claude Code mit selbstlernender Memory: Karpathy-inspirierte Wissensdatenbank für Agenten — Cole Medin (YT), 2026-04-06
Archon: Harness-Builder für reproduzierbare AI-Coding-Workflows — Cole Medin (YT), 2026-04-11
Replit KI-Agent: App-Erstellung ohne Code in 15 Minuten — Henry Hasselbach (YT), 2026-02-28
Obsidian + Claude Code: Wissensmanagement mit KI-Kontext aufbauen — Julian Ivanov (YT), 2026-03-29
Claude Code: JARVIS – KI-Agent für Browser-Automatisierung (Template) — Julian Ivanov (YT), 2026-04-08
AI Dark Factory schickt erste Live-Anwendung in Produktion — Cole Medin (YT), 2026-04-28