KI-News · PyGround

Agenten & Tool-Use Ghost AI: Wenn KI-Agenten ihre eigenen Welten erschaffen

Ein neues Tool namens Ghost AI ermöglicht es KI-Agenten, disposable Welten zu bauen – eine interessante Anwendung für autonome Systeme.

30.05.2026 · Wes Roth (YT)

Enterprise AIE WF: Neue Schwerpunkte für Gründer und Ingenieure

AIE stellt neue Arbeitsschwerpunkte für Gründer und Forward-Deployed Engineers vor.

30.05.2026 · Latent Space

Agenten & Tool-Use Anthropic stellt Claude Opus 4.8 vor – mit verbesserter Ehrlichkeit und Multi-Agent-Workflows

Anthropic bringt Claude Opus 4.8 mit gestärkter Selbstverifizierung und Multi-Agent-Fähigkeiten, während sich die Leistung Benchmarks OpenAIs GPT-5.5 annähert.

30.05.2026 · AI Daily Brief (YT)

Agenten & Tool-Use Claude Opus 4.8: Zuverlässiger coden statt Benchmark-Sprünge

Anthropics neues Flaggschiff-Modell Opus 4.8 glänzt vor allem durch höhere Zuverlässigkeit und Ehrlichkeit beim Code – ein Fokus auf praktische Verbesserungen statt Benchmark-Rekorde.

29.05.2026 · IchBinFabian (YT)

Frontier-Modelle OpenAI rüstet GPT-5.5 Instant auf und verabschiedet ältere Modelle

OpenAI verbessert GPT-5.5 Instant mit natürlicherer Sprachfähigkeit und integriert Schreib- und Code-Tools direkt ins Chat-Interface – ältere Modelle wie o3 und GPT-4.5 werden bis August 2026 abgeschaltet.

29.05.2026 · The Decoder (DE)

Frontier-Modelle Google behebt Bugs bei Gemini-Nutzungslimits

Google fixt mehrere Fehler, die das Videogenerierungs-Kontingent in Gemini zu schnell aufbrauchten – Ultra-Nutzer erhalten jetzt doppelte Limits.

29.05.2026 · The Decoder (DE)

Enterprise 500 Millionen Dollar KI-Rechnung: Unternehmen vergisst Claude-Limits

Ein Unternehmen soll in einem Monat 500 Millionen Dollar für Claude-Lizenzen ausgegeben haben, weil keine Nutzungslimits eingerichtet waren.

29.05.2026 · The Decoder (DE)

Policy & Ethik Der Papst entdeckt künstliche Intelligenz

Das Vatikan veröffentlicht eine Enzyklika zur KI-Ethik und betont die Verantwortung der Menschheit im Zeitalter intelligenter Maschinen.

29.05.2026 · Matthew Berman (YT)

Enterprise Stratechery-Wochenrückblick: Kontroverse um Luce, KI-Monetarisierung und Chinas Mobilität

Ein Stratechery-Digest über die Luce-Kontroverse, Geschäftsmodelle für KI-Antworten und soziale Mobilität in China.

29.05.2026 · Stratechery

Frontier-Modelle OpenAI startet Biodefense-Programm: GPT-Rosalind für Pandemievorsorge

OpenAI stellt sein spezialisiertes Biologie-Modell GPT-Rosalind kostenlos zur Pandemiebekämpfung und biologischen Gefahrenabwehr bereit – erste Partner sind renommierte Forschungsinstitute und globale Gesundheitsorganisationen.

29.05.2026 · The Decoder (DE)

Frontier-Modelle Claude Opus 4.8 im Detail: 15 versteckte Features und Capabilities

Anthropics neues Flaggschiff-Modell ist da – doch vieles in den 244 Seiten der System Card und den Benchmarks dürfte Nutzer überraschen.

29.05.2026 · AI Explained (YT)

Agenten & Tool-Use Die alljährliche KI-Stagnations-Panik kehrt zurück

DeepSWE-Benchmark offenbart Leistungslücken bei komplexen Coding-Aufgaben, während Tokenknappheit und Finanzierungsdruck das Marktmodell unter Druck setzen.

29.05.2026 · AI Daily Brief (YT)

Coding-Modelle Braintrust nutzt Codex und GPT-5.5 für schnellere Entwicklung

Braintrust-Ingenieure setzen Codex mit GPT-5.5 ein, um Experimente durchzuführen und schneller Code zu schreiben.

29.05.2026 · OpenAI Blog

Enterprise Bostons Kinderkrankenhaus nutzt KI zur Diagnose seltener Krankheiten

Ein amerikanisches Spitzenkrankenhaus hat mit OpenAI-Technologie über 40 Fälle seltener Krankheiten aufgeklärt, die vorher rätselhaft blieben.

29.05.2026 · OpenAI Blog

Agenten & Tool-Use Die unterschätzte Schicht: Warum Software-Infrastruktur der echte Engpass von KI-Agenten ist

Forscher argumentieren, dass nicht das Sprachmodell selbst, sondern die umgebende Infrastruktur-Schicht (Tools, Speicher, Kontrollen) entscheidend für autonome KI-Agenten ist – ein Paradigmenwechsel, den auch DeepSeek mit einem neuen "Harness"-Team umsetzt.

29.05.2026 · The Decoder (DE)

Enterprise Amazon deaktiviert internes KI-Ranking: Mitarbeiter trieben Kosten mit „Tokenmaxxing" in die Höhe

Amazonas zieht ein internes KI-Leaderboard zurück, nachdem Beschäftigte durch sinnlose KI-Nutzung die Cloud-Kosten des Konzerns massiv aufblähten.

29.05.2026 · The Decoder (DE)

Frontier-Modelle OpenAI startet Rosalind Biodefense – GPT für Biosicherheit und Pandemievorsorge

OpenAI erweitert den Zugang zu GPT-Rosalind für vetted Developer und US-Regierungspartner im Bereich Biosicherheit und Pandemievorsorge.

29.05.2026 · OpenAI Blog

Frontier-Modelle OpenAI veröffentlicht Leitfaden für unabhängige KI-Evaluationen

OpenAI gibt Richtlinien für externe Bewertungen von KI-Modellen ab – mit Fokus auf aussagekräftige Sicherheitstests bei Frontier-Systemen.

29.05.2026 · OpenAI Blog

Coding-Modelle PyTorch profiling für Anfänger: Optimieren mit torch.profiler

Ein praktisches Tutorial zur Performance-Analyse von PyTorch-Modellen mit dem nativen Profiling-Tool torch.profiler.

29.05.2026 · HuggingFace Blog

Dev-Tools Monty: Pydantic untersucht die sichere Python-Sandbox

Simon Willison hat mit Claude die neueste Version von Monty analysiert – einer in Rust implementierten sandboxed Python-Umgebung mit strikten Ressourcenlimits.

22.05.2026 · Simon Willison