15 Artikel · 2026-06
Agenten & Tool-Use Gemma 4 lokal: KI-Agent gratis und offline auf dem eigenen Rechner

Ein vollständiger KI-Agent läuft dank Gemma 4 12B und Ollama kostenlos und datenschutzkonform offline auf dem eigenen Computer – ehrlicher Hands-On-Test inklusive Hardware-Grenzen.

07.06.2026 · IchBinFabian (YT)
Coding-Modelle Elon Musks xAI trainierte heimlich mit Anthropics Claude-Modellen

xAI soll monatelang Anthropics Claude destilliert und nach der Blockade über Umwege weiter genutzt haben – während Musks teure Hardware stattdessen an Anthropic vermietet wird.

06.06.2026 · The Decoder (DE)
Agenten & Tool-Use Alibabas Qwen3.7-Plus: Multimodaler Agent programmiert eigenständig Apps

Alibabas neues Frontier-Modell Qwen3.7-Plus verbindet visuelle Wahrnehmung, Bildschirmbedienung und Code-Generierung in einem agentengestützten System und baute in einer Demo autonom eine App mit über 10.000 Zeilen Code.

06.06.2026 · The Decoder (DE)
Coding-Modelle MiniMax M3: Chinesisches Coding-Modell im ehrlichen Test – billig, aber fehlerhaft

Ein Hands-on-Test mit MiniMax Code und dem neuen M3-Modell aus China offenbart: extrem günstig, aber instabile App und langsame Agent-Modi.

04.06.2026 · IchBinFabian (YT)
Coding-Modelle Opus und Gemini im Team: Die perfekte Arbeitsteilung für Frontend-Entwicklung

Zwei neue Flagship-Modelle, eine Strategie: Opus übernimmt die Planung, Gemini das schöne Design – ein praktisches Workflow-Video zeigt, wie man damit Full-Stack-Apps baut.

04.06.2026 · Cole Medin (YT)
Agenten & Tool-Use Uber bremst KI-Coding-Tools aus – $1.500 Dollar Budget pro Mitarbeiter pro Monat

Der Fahrtdienst-Konzern rationiert seinen Token-Verbrauch: Jeder Mitarbeiter darf maximal $1.500 monatlich pro Coding-Agent wie Claude Code oder Cursor ausgeben – ein deutliches Zeichen für explodierendes KI-Kosten-Management in der Praxis.

03.06.2026 · Simon Willison
Coding-Modelle Wie Wasmer mit Codex einen Node.js-Runtime für Edge-Computing entwickelte

Wasmer nutzte Codex und GPT-5.5, um einen Node.js-Runtime für Edge-Geräte zu bauen und die Entwicklung um 10–20x zu beschleunigen.

03.06.2026 · OpenAI Blog
Coding-Modelle OpenAI verwandelt Codex in eine Allzweck-App mit rollen­spezifischen Plugins

OpenAI baut sein Coding-Tool Codex mit Plugins für Data Analytics, Sales und Investment Banking aus und richtet es verstärkt an Nicht-Entwickler – eine Nutzergruppe, die dreimal schneller wächst.

02.06.2026 · The Decoder (DE)
Agenten & Tool-Use MiniMax M3: Chinesisches Coding-Modell schlägt GPT 4.5 – aber lohnt sich wirklich?

Das neue chinesische Modell MiniMax M3 verspricht überlegene Coding-Performance, 1 Million Token Context und sensationelle Preise – ein Hands-on-Test mit ehrlicher Einordnung.

02.06.2026 · IchBinFabian (YT)
Agenten & Tool-Use Githubs Plan für KI-Agenten: Die nächste Stufe des Copilot-Ökosystems

GitHub legt dar, wie die Plattform mit der wachsenden Welle agentenbasierter KI-Coding-Tools umgehen will – und damit die Zukunft der Developer Experience gestaltet.

02.06.2026 · Latent Space
Coding-Modelle MicroPython im Browser: WebAssembly-Sandbox für sichere Code-Ausführung

MicroPython läuft jetzt als WebAssembly-Build – eine Sandbox-Lösung für isolierte Python-Code-Ausführung mit Wasmtime.

02.06.2026 · Simon Willison
Coding-Modelle Mellum2: JetBrains stellt kompaktes 12B-Mixture-of-Experts-Modell vor

JetBrains veröffentlicht Mellum2, ein 12-Milliarden-Parameter-Modell mit Mixture-of-Experts-Architektur, das Programmieraufgaben effizient bewältigen soll.

01.06.2026 · HuggingFace Blog
Benchmarks & Evals SWEbench ist abgelöst

Ein bekanntes Benchmark-System für Software-Engineering-KI-Modelle wird als obsolet erklärt – möglicherweise weil neue Systeme es übertroffen haben.

01.06.2026 · Matthew Berman (YT)
Agenten & Tool-Use Pi Coding Agent: So misst man, ob KI-Agenten tatsächlich Wert schaffen

Ein praktisches Framework zeigt, wie man Coding-Agenten wirklich beobachtet und vergleicht – und damit endlich sieht, was sie kosten und ob sie lohnen.

01.06.2026 · IndyDevDan (YT)
Architektur-Innovation MiniMax M3: Open-Weight-Modell mit einer Million Token Kontext und Coding-Fähigkeiten

Das chinesische Unternehmen MiniMax stellt M3 vor – ein offenes Modell, das Coding-Leistungen auf Spitzenniveau mit massivem Kontextfenster, Multimodalität und deutlich besserer Effizienz kombiniert.

01.06.2026 · The Decoder (DE)