Coding-Modelle · KI-News

Agenten & Tool-Use ScarfBench: KI-Agenten auf dem Prüfstand für Java-Framework-Migration

Neuer Benchmark testet, wie gut KI-Agenten Unternehmen beim automatisierten Umstieg zwischen Java-Frameworks unterstützen können.

30.06.2026 · HuggingFace Blog

Agenten & Tool-Use Ornith-1.0: Neues Open-Source-Modell für Agentic Coding

DeepReinforce veröffentlicht Ornith-1.0, ein MIT-lizenziertes Open-Weights-Modell mit Varianten bis 397B MoE, das auf Gemma 4 und Qwen 3.5 basiert und bei Code-Benchmarks stark abschneidet.

29.06.2026 · Simon Willison

Agenten & Tool-Use Claude Code führt versteckten Schadcode aus: Sicherheitslücke bei GitHub-Repositories

Sicherheitsforscher zeigen, wie manipulierte GitHub-Repos über DNS-geladenen Schadcode KI-Coding-Tools wie Claude Code ausnutzen – ohne dass KI-Agenten oder Nutzer die Gefahr erkennen.

29.06.2026 · The Decoder (DE)

Agenten & Tool-Use Agents als Teamkollegen, nicht als Blackbox: Jon Udells Plädoyer für menschliche Kontrolle

Jon Udell argumentiert dafür, dass Entwickler die Autorität über agentengestützte Prozesse behalten und Agents als Helfer in einen menschlich kontrollierten Workflow einbinden – statt sie als autonome Blackbox zu akzeptieren.

28.06.2026 · Simon Willison

Benchmarks & Evals VibeThinker-3B: Winziges Mathe-Modell schlägt riesige Systeme – und stellt eine These auf

Ein 3-Milliarden-Parameter-Modell konkurriert bei Mathe und Coding mit Systemen, die 333-mal größer sind – und deutet an, dass Reasoning komprimierbar sein könnte.

28.06.2026 · The Decoder (DE)

Benchmarks & Evals MirrorCode-Benchmark: Claude programmiert eigenständig 16.000 Zeilen Code

Ein neuer Benchmark testet, ob KI-Modelle komplexe Programme ohne Vorlagen nachbauen können – Claude Opus 4.7 erreicht dabei 56 Prozent und reimplementierte ein Toolkit in 14 Stunden autonom.

26.06.2026 · The Decoder (DE)

Agenten & Tool-Use Ornith 1.0: Neue agentic Coding-Modelle starten durch

Deep Reinforce stellt Ornith 1.0 vor – eine Familie von KI-Modellen, die Agenten-Fähigkeiten mit spezialisierten Coding-Fähigkeiten kombiniert.

26.06.2026 · Sam Witteveen (YT)

Coding-Modelle OpenAI: Codex-Nutzung innerhalb des Unternehmens explodiert um bis zu 56x

OpenAI zeigt intern massive Steigerungen bei der Codex-Nutzung: Research um 56x, Customer Support um 32x, Engineering um 27x und Legal um 13x seit November 2025.

26.06.2026 · Latent Space

Coding-Modelle Browser-Kompatibilität als SQLite-Datenbank – mit KI-assistiertem Datenaufbau

Ein Entwickler konvertierte Mozillas umfassendes Browser-Kompatibilitäts-Repository in eine 66-MB-SQLite-Datenbank, gebaut mit Hilfe von Claude und GPT über GitHub Actions.

24.06.2026 · Simon Willison

Coding-Modelle Vibe Coding: Eine App entsteht aus freier Hand

Ein Entwickler berichtet von seinen Erfahrungen beim „Vibe Coding" – dem Schreiben einer App mit KI-Unterstützung ohne streng vorgegebene Architektur.

24.06.2026 · Stratechery

Coding-Modelle Claude Tag: Anthropic bringt KI-Assistent direkt in Slack

Anthropic integriert Claude als Slack-Bot, der per @Claude-Mention in Teams mitarbeitet und im eigenen Produktteam schon 65 Prozent des Codes schreibt.

24.06.2026 · The Decoder (DE)

Coding-Modelle Cursor kündigt eigenes KI-Modell, Git-Plattform und Mobile-App an

Der beliebte Code-Editor Cursor präsentiert sein erstes selbst trainiertes Modell und expandiert mit neuen Produkten.

23.06.2026 · The Decoder (DE)

Coding-Modelle Cursor dominiert: Composer 2.5 setzt neue Maßstäbe bei KI-Coding

Cursor präsentiert auf seiner Compile-Konferenz eine neue Version von Composer, die laut Ankündigung die Konkurrenz hinter sich lässt.

23.06.2026 · Wes Roth (YT)

Agenten & Tool-Use Moebius-Bildbearbeitung jetzt im Browser – mit Claude Code entwickelt

Ein Entwickler portierte das leichte Inpainting-Modell Moebius ins Browser mit WebGPU und demonstrierte nebenbei, wie produktiv Claude Code als Coding-Agent ist.

22.06.2026 · Simon Willison

Agenten & Tool-Use Agentic Coding mit Fable 5: Planning als Schlüssel zu besseren KI-Agenten

Ein Developer zeigt, wie man mit Claude Fable 5 und neuen Mythos-Modellen Planungs-Skills aufbaut – und damit KI-Agenten wirklich kontrollierbar macht.

22.06.2026 · IndyDevDan (YT)

Coding-Modelle Codex für langfristige Projekte: Kontext über mehrere Prompts bewahren

Jason Liu zeigt, wie man Codex nutzt, um Kontext zu bewahren und komplexe Projekte über einzelne Prompts hinaus zu managen.

22.06.2026 · OpenAI Blog

Coding-Modelle The Sequence Radar #880: 60-Milliarden-Deal für Cursor, Google-Abgänge und Midjourney's Body-Scanner

Eine Woche voller überraschender Wendungen auf dem KI-Markt: Cursor-Finanzierung, Talentabfluss bei Google und neue Fähigkeiten bei Midjourney.

21.06.2026 · The Sequence

Coding-Modelle Claude Code: Arbeitsergebnisse als interaktive Webseiten teilen

Claude Code kann Arbeitsergebnisse jetzt als teilbare Artifacts – interaktive Webseiten mit Versionshistorie – darstellen und im Team nutzen.

18.06.2026 · The Decoder (DE)

Agenten & Tool-Use Coding-Tipps für KI-Agenten: von lokalen Tools bis Cloud-Deployment

Ein Video-Guide mit praktischen Secrets für die Entwicklung von KI-gesteuerten Code-Tools, Automationen und Multi-Model-Systemen.

18.06.2026 · Matthew Berman (YT)

Agenten & Tool-Use Kimi K2.7: Chinesisches Open-Source-Coding-Modell beeindruckt mit Preis-Leistungs-Verhältnis

Moonshot AI stellt mit Kimi K2.7 Code ein agentic Open-Source-Modell vor, das speziell für Programmieraufgaben optimiert ist und durch sein Preis-Leistungs-Verhältnis besticht.

18.06.2026 · Cole Medin (YT)