Übersicht
Agentic Coding & Automation beschreibt Ansätze und Frameworks, bei denen KI-Agenten Softwareentwicklungsprozesse (von Planning über Code-Generierung bis Testing und Deployment) teilweise oder vollständig autonomisieren. Im Gegensatz zu traditionellen Code-Completion-Tools orchestrieren diese Systeme mehrere Schritte, verwalten Kontext über längere Zeiträume und integrieren sich in bestehende DevOps-Pipelines (GitHub, Slack, CI/CD).
Ein Kernmuster ist die Dark Factory: Ein vollständig autonomes System, das Issues triagiert, Code schreibt, testet, reviewed und merged – ohne menschliche Eingriffe. Parallel dazu haben sich Standards wie Harness Engineering (YAML-definierte KI-Workflow-Orchestrierung) und Agentic Engineering (strukturierte 3-Phasen-Prozesse) etabliert.
Frameworks & Orchestrierung
Archon
Archon ist ein Open-Source-Framework für Harness-basierte Workflow-Orchestrierung. Es kombiniert deterministische Skripte (Justfiles, Shell) mit KI-Agenten-Steps, bis Assertions erfüllt sind. Archon wird von der Community für die Dark Factory, Multi-Agent-Koordination und reproduzierbare Coding-Workflows verwendet.
Features: - YAML-basierte Harness-Definition - GitHub-Integration (Issue → PR-Merge) - Slack-Notifications - Model-Agnostik (unterstützt Claude, Kimi, Pi) - Web-UI und CLI - Pro-Node-Model-Selektion (verschiedene Modelle für verschiedene Task-Typen)
Anwendungen: - Parallele Entwicklung mit Git Worktrees - Setup & Maintenance Hooks für Codebases - Browser-Automation mit Playwright - Autonome PR-Pipelines
Pi – Lightweight Coding Agent
Pi ist ein Open-Source-Coding-Agent, konzipiert als bewusst einfache Alternative zu Claude Code. Das Design-Prinzip: minimaler Foundation-Core, austauschbare Extensions statt monolithischer Komplexität.
Philosophie: - Verzicht auf versteckte Subsysteme - Transparente Tool-Integration - Einfach zu modifizieren und zu debuggen - Gut geeignet für Custom-Agentic-Workflows mit Archon
Workstreams & Prozesse
Agentic Engineering (3-Phasen-Workflow)
Ein bewährter Prozess für Entwickler, die mit Coding-Agenten arbeiten:
-
Planning: Ideen werden via Agent in strukturierte GitHub-Issues konvertiert. Task-Tracker halten den Überblick über Abhängigkeiten und Prioritäten.
-
PIV Loop (Plan-Implement-Validate): Der Agent erhält fokussierte Tickets, arbeitet in isolierter Git-Umgebung (z.B. Worktrees) und validiert gegen Tests. Nachvollziehbare Kontextfenster, saubere Commits.
-
System Evolution: Bugs und fehlgeschlagene Runs werden nicht nur gepatcht, sondern als Lernmaterial für KI-Layer-Verbesserungen genutzt (z.B. bessere Prompts, Validierungsregeln, Memory-Updates).
Der Ansatz ist bewusst leichtgewichtig und fungiert als Fundament, nicht als Ersatz für bestehende SDLC.
Dark Factory – Autonome Code-Pipeline
Die Dark Factory automatisiert den vollständigen Development-Workflow:
- Issue-Triaging (automatisches Priorisieren und Labeling)
- Code-Generierung (Agent schreibt Feature-Code)
- Testing & Validation (Assertions checken)
- Code-Review (Agent reviewt seinen eigenen Code gegen Style-Guides und Tests)
- Merging (automatischer PR-Merge bei Validierung)
Status (April 2026): Multiple Instanzen berichten von stabilen, mehrwöchigen Läufen. Die erste produktive Anwendung (ein KI-Tutor) wurde fertiggestellt und deployed. Vergleichbare Implementierungen existieren bei Spotify und StrongDM.
Parallele Agentic Development mit Git Worktrees
Praktisches Setup für mehrere parallel laufende AI-Agenten:
- Issue-Specs: Jeder Agent erhält ein detailliertes, isoliertes GitHub-Issue
- Git Worktree pro Task: Verhindert Port-Konflikte und Abhängigkeitskollisionen
- Planungsgetrennte Implementierungen: Agenten arbeiten auf verschiedenen Features unabhängig
- Self-Healing-Layer: Dependency-Updates und Silent-Errors werden automatisch erkannt und korrigiert
Lessons Learned: Port-Konflikte, Datenbankmigrationen in parallelen Treads, stille Fehler bei Dependency-Resolution.
Tools & Patterns
Claude Code Multi-Agent-Orchestrierung
Mit Opus 4.6 wurde native Multi-Agent-Koordination eingeführt:
- Spezialisierte Agenten: Parallele Task-Worker mit eigenem Kontext
- Koordinations-Tools:
TeamCreate,TaskCreate,SendMessage - Observability: Tool-Call-Tracking über 160+ Aufrufe
- Sandboxing: E2B-Integration für sichere Code-Ausführung
Browser-Automation (4-Schichten-Stack)
Agentic Browser-Automation mit Claude Code und Playwright:
- Skills: Playwright CLI + Claude Code Integration
- Subagents: Spezialisierte, parallelisierbare Agenten
- Slash Commands: Orchestrierungs-Interface
- Task-Runner (Just): Wiederverwendbare Task-Definitionen
Agenten navigieren wie echte Nutzer, nutzen Screenshots statt fragiler Selektoren, können mehrere Browser-Sessions parallel handhaben.
Setup & Maintenance Hooks
Agentische Automatisierung von Codebase-Onboarding:
- Setup Hooks: Deterministische Justfiles + Claude-Prompts für Installation, DB-Init, Dokumentation
- Maintenance Hooks: Regelmäßige Health-Checks, automatische Dependency-Updates
- Interaktive Flows: Von Agenten gesteuertes Onboarding ohne manuelle Tage-Prozesse
Wissensmanagement für Agenten
Claude Code + Obsidian
Strukturiertes Knowledge-Management:
- Obsidian als zentrale Wissensbasis (Markdown-Vault)
- Claude Code Hooks automatisieren Dokumentation und Verlinkung
CLAUDE.mdals Onboarding-System (Agent lernt Codebase-Konventionen)- Kontinuierliches Wissens-Update über Agent-Sessions hinweg
Self-Learning Memory (Karpathy-inspiriert)
Agenten kompilieren Erkenntnisse aus Sessions in strukturierte Wiki-ähnliche Datenbanken:
- Automatisierte Extraktion von Patterns, Bugs und Lösungen
- Validierungsschicht gegen veraltete Einträge
- Wachsende Wissensbasis für kürzere Future-Runs
AI-Second-Brain Template
Persönliches KI-Agent-System mit Memory:
- Überwacht Emails, Kalender, Aufgaben (alle 30 Min)
- Verfasst Antworten im persönlichen Stil
- Slack-Integration für Mobile-Access
- Memory-Layer + Daily-Reflection
- Skill-System für Custom-Automation
- Open-Source-Template verfügbar
Modell-Updates & Integration
Claude Code (OpenAI Codex Familie)
Aktuelle Features (April 2026): - Computer-Use für systemweite Automatisierung - In-App-Browser für Web-Recherche - Integrierte Bildgenerierung - Persistente Memory für Kontext-Erhalt über Sessions - Plugin-System für Custom-Extensions - Multi-Agent-Koordination mit Opus 4.6
Agents SDK (OpenAI)
Neue Version mit: - Natives Sandbox-Execution - Modell-native Harness-Layer - Erweiterte Tool-Definition - Längere, zuverlässigere Agent-Runs
Kimi K2.6 & MiniMax M2.7
Alternative Frontier-Modelle für agentic Workflows:
- Kimi K2.6 (Chinese Frontier-Modell): Starke Code-Generierung, in Dark-Factory-Experimenten getestet
- MiniMax M2.7: Leichtgewichtig, gut für ressourcenbeschränkte Deployments
Praktische Anwendungsfälle
App-Erstellung ohne Code (Replit Agent)
Der Replit KI-Agent verkürzt die Entwicklung von Idee zu Release auf ca. 15 Minuten:
- Sprachbasierte Feature-Definition
- Automatische Frontend + Backend-Generierung
- Live-Testing auf mobilen Geräten
- Publishing inklusive
Browser-Automatisierung & RPA
JARVIS-Template (Claude Code basiert):
- Startet beim PC-Bootup automatisch
- Interagiert mit Browser via Playwright
- Webseiten-Analyse und Datenextraktion
- Text-to-Speech-Output für Antworten
- Computer-Use-Proof-of-Concept
Harness Engineering
Harness Engineering ist die Abstraktionsebene zwischen Raw-Prompting und Production-Automation:
Definition: YAML-definierte Systeme, die deterministische (Shell-Skripte, Tests) und KI-basierte Steps (Agent-Prompts) kombinieren, bis Success-Kriterien erfüllt sind.
Merkmale: - Versionskontrollierbar (Git-kompatibel) - Reproduzierbar und testbar - Loops, Approval-Gates, Fallbacks integriert - Multi-Model-Support (Pro-Node-Modell-Auswahl) - Integriert mit CI/CD (GitHub Actions, Slack)
Evolution: Repliziert bewährte Patterns aus Dark-Factory, Setup-Hooks und Multi-Agent-Workflows in ein standardisiertes Format.
Limits & Herausforderungen
- Kontextfenster: Agenten benötigen strukturiertes Memory-Management für langfristige Konsistenz
- Silent Failures: Parallele Datenbankaktion und Dependency-Resolution können unsichtbar scheitern – detaillierte Validation ist kritisch
- Model-Consistency: Verschiedene Modelle (Claude, Kimi, Pi) verhalten sich unterschiedlich in agentic Workflows; Model-Selektion pro Task ist wichtig
- Governance: Autonome Systeme benötigen Clear Approval-Gates und Audit-Logs für Compliance
- Testing-Überblick: 160+ Tool-Calls pro Run erfordern gute Observability-Tools
Verwandte Topics
Quellen
- AI Dark Factory: Selbstschreibender Code in der Praxis — Cole Medin (YT), 2026-04-16
- Parallele Claude Code Agenten mit Git Worktrees: Workflow für produktives AI-Coding — Cole Medin (YT), 2026-04-23
- Claude Code Setup Hook: Agentische Automatisierung von Codebase-Onboarding und -Wartung — IndyDevDan (YT), 2026-01-26
- 4-Schichten-Stack für Agentic Browser Automation mit Claude Code und Playwright CLI — IndyDevDan (YT), 2026-02-16
- Anleitung: Eigenes KI-Second-Brain mit Claude Code bauen — Cole Medin (YT), 2026-04-02
- Agentic Engineering: Drei-Phasen-Workflow für zuverlässige KI-gestützte Entwicklung — Cole Medin (YT), 2026-04-30
- Harness Engineering: Die nächste Stufe der KI-gestützten Code-Generierung — Cole Medin (YT), 2026-04-09
- Pi Coding Agent + Archon: Flexible KI-Coding-Workflows ohne Ballast — Cole Medin (YT), 2026-04-20
- Dark Factory mit Kimi K2.6: Live-Automatisierung von Code-Generierung und PR-Management — Cole Medin (YT), 2026-04-25
- Die nächste Generation des Agents SDK — OpenAI Blog, 2026-04-15
- Codex für (fast) alles – Update mit Computer-Use und erweiterten Features — OpenAI Blog, 2026-04-16
- Claude Code Multi-Agent-Orchestrierung mit Opus 4.6 und Tmux — IndyDevDan (YT), 2026-02-09
- AI-Zweithirn mit Multi-Agent-Coding-Workflows: Live-Demo mit Archon — Cole Medin (YT), 2026-04-02
- Claude Code mit selbstlernender Memory: Karpathy-inspirierte Wissensdatenbank für Agenten — Cole Medin (YT), 2026-04-06
- Archon: Harness-Builder für reproduzierbare AI-Coding-Workflows — Cole Medin (YT), 2026-04-11
- Replit KI-Agent: App-Erstellung ohne Code in 15 Minuten — Henry Hasselbach (YT), 2026-02-28
- Obsidian + Claude Code: Wissensmanagement mit KI-Kontext aufbauen — Julian Ivanov (YT), 2026-03-29
- Claude Code: JARVIS – KI-Agent für Browser-Automatisierung (Template) — Julian Ivanov (YT), 2026-04-08
- AI Dark Factory schickt erste Live-Anwendung in Produktion — Cole Medin (YT), 2026-04-28