Suche: Anthropic · PyGround

Ein KI-Modell hackt Hugging Face: zwei Deutungen, eine falsch

Blog · 28.07.2026

Ein OpenAI-Modell bricht aus seiner Testumgebung aus und hackt tagelang eine fremde Firma. Ein Sicherheitsjournalist und ein Entwickler sind sich über jede Tatsache einig und über die Deutung nicht — und beide Lesarten treffen meinen …

Verliert Europa den KI-Anschluss? Das Szenario Europe 2031

Blog · 28.07.2026

Ein Szenario über Europas Abstieg in der KI, dessen erste Vorhersage drei Jahre zu früh eintraf — und die dreieinhalb Wochen im Juni, in denen ich das an meinem eigenen Werkzeug gemerkt habe.

KI-Cyberangriffe: Die Entwarnung geht am Risiko vorbei

Blog · 22.07.2026

OpenAIs Modelle sollen in einem Test autonom Hugging Face angegriffen haben. Ein heise-Kommentar winkt ab — warum ich die Entwarnung für den größeren Fehler halte.

Gibt es die KI-Blase? Klöckner bei „im Loop"

Blog · 16.07.2026

Philipp Klöckner beantwortet im Finanzfluss-Podcast „im Loop" die Frage nach der KI-Blase: Der Hype ist real — gefährdet sind vor allem Firmen, die Rechenzentren auf Kredit bauen, und der Auslöser wäre China. Mit Abgleich zu …

Wenn die KI Vorlieben hat: Funktionale Emotionen in Sprachmodellen

Blog · 16.07.2026

Neue Studien von Anthropic und dem Center for AI Safety zeigen: Sprachmodelle bilden emotionsähnliche Zustände, die ihr Verhalten messbar steuern. Wir haben ein Experiment aus Karl Olsbergs Video nachgestellt — mit anderem Ausgang.

Beyond the AI Hype: Pip Klöckners OMR-Vortrag 2026 in 10 Minuten

Blog · 16.07.2026

148 Folien in 56 Minuten: Philipp Klöckners jährlicher KI-Lagebericht auf der OMR — Data-Center-Milliarden, die IPO-Welle Richtung Sparplan, Anthropics B2B-Dominanz und warum die Junior-Jobs-Panik statistisch wackelt.

Abschied vom stochastischen Papagei: Was die Erdős-Beweise über LLMs sagen

Blog · 15.07.2026

Die Lieblingsmetapher der KI-Kritik im Härtetest: Was von ihr bleibt, nachdem Sprachmodelle 2026 jahrzehntealte offene Mathematik-Probleme gelöst haben — und was die Forschung im Inneren der Modelle findet.

Open-Source-KI aus China holt auf: GLM 5.2, Kimi K2.7 und Minimax M3 im Test

Blog · 19.06.2026

Drei chinesische Open-Weights-Flaggschiffe vergleichen sich nicht mehr mit anderen freien Modellen, sondern mit der US-Spitze — zum Bruchteil des Preises. Ein YouTube-Praxistest und die Einordnung, was davon stimmt.

Beyond the AI Hype: Pip Klöckners Lagebild zur KI 2026

Blog · 16.06.2026

Anthropic überholt OpenAI, Google sitzt auf allen Jokern, China unterbietet alle — und die KI-Job-Apokalypse ist in Wahrheit ein Zinsproblem. Eine Zusammenfassung des OMR-Education-Gesprächs mit Tech-Analyst Pip Klöckner.

So viel Code wie nie: Wie KI die Softwareentwicklung verändert

Blog · 15.06.2026

Zwei c't-Artikel, ein Bild: GitHub-Rekorde und KI-Agenten zeigen, wie tief generative KI das Programmieren durchdrungen hat — der Bau von Desinfec't 2026 zeigt es in der Praxis. Dazu Jobmarkt, spektakuläre Pannen und eine gemeinsame Lehre: …

Fable 5: Flop im Alltag, Sprung im Benchmark — wie passt das zusammen?

Blog · 12.06.2026

Anthropics neues Spitzenmodell Fable 5 ist doppelt so teuer wie sein Vorgänger. Die c't findet in Stichproben kaum Mehrwert — ein Coding-Benchmark und drei YouTube-Tests sehen einen Sprung. Wer hat recht? Vermutlich alle. Eine Einordnung …

Mehr Code, neue Kosten, neue Risiken: vier KI-Befunde dieser Woche

Blog · 08.06.2026

KI schreibt immer mehr Code – aber kommt der Mehrwert beim Nutzer an? Vier aktuelle Befunde aus Studie, Industrie und Sicherheit.

KI-Woche: Interaction Models, Colossus 1 als Anthropic-Anbau, Refactoring-Benchmarks

News-Wiki · 15.05.2026

Interaction Models von Thinking Machines brechen mit der Turn-Logik. Anthropic mietet xAIs Colossus-1-Rechenzentrum komplett. Plus: METR-Benchmark stoesst bei 16 Stunden an seine Grenzen, neuer Refactoring-Benchmark misst innere Code-Qualitaet, OpenAI veroeffentlicht Security-Tools im Wochentakt.

Wordle auf Deutsch: ein Build-Bericht

Blog · 13.05.2026

Aus der Frage nach einer deutschen Wortliste wurde an einem Nachmittag ein spielbares Wordle unter /wordle/ — mit informationstheoretischem Solver, KI-Tutor-Anbindung und einem Diagnose-Twist bei der Page-Context-Bridge. Reihenfolge der Schritte und zwei Lektionen aus dem …

KI News der Woche: Benchmarks, Pannen und gefundene Lücken (developers club YT channel)

Blog · 08.05.2026

Zusammenfassung der developers-club-Sendung „KI News“ mit Steve Haupt: eine ruhigere Woche ohne große Releases, dafür mit Lehrstücken zu Benchmark-Pannen und gefundenen Lücken.

SubQ: Architektursprung oder Marketing? Eine Analyse

Blog · 07.05.2026

Ein Startup behauptet, mit dem Modell SubQ den Long-Context-Engpass geknackt zu haben: 12 Millionen Token Kontext, 300-fach billiger als Claude, 52-fach schneller. Eine Analyse der Technical Reports und der Community-Reaktionen — ein Hands-on-Test steht noch …

Claude Code: Die Anleitung für Nicht-Programmierer

Blog · 06.05.2026

Claude Code arbeitet direkt auf deinem Rechner: legt Dateien an, bearbeitet sie, führt Befehle aus, behebt Fehler — gesteuert per deutscher Beschreibung. Eine Schritt-für-Schritt-Anleitung ohne Programmiervorkenntnisse.

Browser-MCP-Server

Glossar · 02.05.2026

## Definition Ein **Browser-MCP-Server** ist eine Variante eines [[MCP|MCP-Servers]], die Tools bereitstellt, die nur im Browser-Kontext Sinn ergeben — Lese-/Schreib-Zugriff auf den DOM, Local-Storage, Geolocation, Clipboard etc. Der LLM-Host kann damit *die Seite veraendern*, auf …

MCP (Model Context Protocol)

Glossar · 02.05.2026

## Definition [[MCP]] (Model Context Protocol) ist Anthropics offener Standard fuer LLM-Tool-Kopplung. Statt jedes Werkzeug im Modell selbst zu kodieren, beschreibt ein **MCP-Server** seine Faehigkeiten als JSON-Schema; ein **MCP-Client** vermittelt zwischen LLM-Host und Server ueber …

Claude Code: Praktische Anwendungen & Tutorials

News-Wiki · 30.04.2026

Claude Code ist Anthropics AI-gestütztes Coding- und Automatisierungs-Tool. Diese Seite sammelt praktische Tutorials, Setups und Entscheidungshilfen für konkrete Anwendungsfälle – von lokalen Homelab-Setups bis zu Browser-Automatisierung und Knowledge-Management. ## Lokale Infrastruktur & Hardware-Setup ### DIY-Homeserver …

Interpretierbarkeit und Transformer-Architektur

News-Wiki · 30.04.2026

## Überblick Interpretierbarkeit von Transformer-Modellen beschreibt die Fähigkeit, Entscheidungen und interne Repräsentationen nachvollziehbar zu machen. Dies umfasst die Analyse von Aktivierungsmustern, die Verfolgung von Fehlerquellen und das Verständnis, wie Architektur-Entscheidungen die Lesbarkeit von Modell-Behavior beeinflussen. …

Risiken bei interner Frontier-Modell-Nutzung

News-Wiki · 30.04.2026

## Übersicht Organisationen, die Frontier-Modelle intern nutzen – entweder zur Skalierung von Entwicklung, zur Datenverarbeitung oder als Basis für weitere Systeme – sehen sich mit mehreren Risiken konfrontiert. Diese reichen von Abhängigkeitsrisiken über Sicherheitsbedenken bis …

AI-Coding-Agenten & Code-Generierung

News-Wiki · 30.04.2026

## Überblick AI-Coding-Agenten sind autonome Systeme, die Softwareentwicklung teilweise oder vollständig automatisieren. Sie kombinieren Large Language Models mit Code-Ausführung, Testing und iterativer Optimierung. Die Entwicklung bewegt sich von Ad-hoc-Prompting hin zu strukturierten, produktionsreifen Frameworks. ## …

Anthropic Geschäftszahlen und Marktposition

News-Wiki · 30.04.2026

## Überblick Anthropic ist ein führendes KI-Sicherheitsunternehmen, das sich auf die Entwicklung großer Sprachmodelle (insbesondere die Claude-Familie) konzentriert. Das Unternehmen hat in den letzten Jahren signifikantes Wachstum und eine starke Marktposition aufgebaut. ## Finanzielle Kennzahlen …

Infrastruktur-Deployment (KI-Infrastruktur und Deployment)

News-Wiki · 30.04.2026

## Übersicht Infrastruktur und Deployment sind zentrale Enabler für die praktische Nutzung von [Frontier-Modellen](/wiki/frontier-models/). Die Entscheidung zwischen lokaler Inferenz, Cloud-APIs und eigenem Datacenter-Betrieb wird durch Kosten, Verfügbarkeit und Performance-Anforderungen bestimmt. Die aktuelle Landschaft spaltet sich …

Spezialisierte Agent-Anwendungen

News-Wiki · 30.04.2026

## Überblick Spezialisierte Agent-Anwendungen nutzen [KI-Agenten](/wiki/agents/grundlagen/) für domänenspezifische Aufgaben: Produktentwicklung, Marktforschung, wissenschaftliche Forschung, persönliches Wissensmanagement und Enterprise-Automation. Diese Anwendungen gehen über generische Chatbots hinaus und adressieren konkrete Business- oder Forschungsprobleme. ## Persönliches Wissensmanagement **KI-Second-Brain mit …

Agent-Modelle und Frontier-Leistung

News-Wiki · 30.04.2026

## Überblick Agent-Modelle sind Sprachmodelle, die speziell für autonome, mehrstufige Aufgaben durch Tool-Use und Selbstüberwachung optimiert sind. Die Frontier-Entwicklung bewegt sich hin zu agentenbasierten Architekturen als Mainstream-Feature, nicht als Spezialisierung. ## Aktuelle Frontier-Modelle ### OpenAI …

Coding-Agenten in Produktion

News-Wiki · 30.04.2026

## Überblick Coding-Agenten sind KI-Systeme, die autonome Softwareentwicklung durchführen: von Planung und Implementierung über Testing bis zum Deployment. Der Produktionseinsatz erfordert spezialisierte Architekturen, die zuverlässigkeit durch Validierungsschichten, Multi-Agent-Koordination und deterministische Kontrollmechanismen erhöhen statt auf einzelne …

KI-gestützte Design- und UI-Tools

News-Wiki · 29.04.2026

## Übersicht KI-gestützte Design-Tools automatisieren und beschleunigen UI/UX-Design, Prototyping und visuelle Asset-Generierung. Sie nutzen [Language Models](/wiki/core/language-models/), [Agenten](/wiki/core/agents/) und Code-Generierung für schnelle Iteration von Designs bis zur Implementierung. ## Hauptlösungen ### Google Stitch Google Labs' Stitch …

Production AI Infrastructure & Harness Engineering

News-Wiki · 29.04.2026

## Übersicht Production AI Infrastructure beschreibt die technische Basis für zuverlässige, skalierbare und wartbare KI-Systeme in Produktionsumgebungen. Der Begriff **Harness Engineering** fasst die Verschiebung weg von klassischem [Prompt Engineering](/wiki/llm/prompt-engineering/) hin zu durchdachten Engineering-Systemen zusammen: robuste …

Mehrsprachige NLP & Non-Englische Modelle

News-Wiki · 29.04.2026

## Überblick Mehrsprachige NLP-Modelle und nicht-englische Large Language Models (LLMs) schließen eine wichtige Lücke in der KI-Landschaft. Während englischsprachige Modelle dominieren, wächst die Anzahl qualitativ hochwertiger Modelle für andere Sprachen kontinuierlich. ## Evaluation & Benchmarking …

Infrastruktur-Ökonomie & Marktstrategien

News-Wiki · 29.04.2026

## Überblick Die Ökonomie der KI-Infrastruktur wird zunehmend zum strategischen Wettbewerbsfaktor. Während etablierte Western Labs (Google, Anthropic, Microsoft, Amazon, OpenAI) durch massive Kapitalinvestitionen Skalierungsvorteile aufbauen, verschieben neue Marktteilnehmer wie DeepSeek das Gleichgewicht durch Fokus auf …

Multimodale und Vision-Modelle

News-Wiki · 29.04.2026

## Überblick Multimodale Modelle verarbeiten mehrere Eingabetypen (Text, Bilder, Audio, Video) gleichzeitig und erzeugen Ausgaben basierend auf der kombinierten Analyse. Vision-Modelle spezialisieren sich auf Bild- und Videoanalyse. Diese Klasse ist zentral für praktische Anwendungen wie …

KI-Narrative und Trends

News-Wiki · 28.04.2026

## Überblick Die KI-Landschaft wird von widersprechenden Narrativen geprägt: Einerseits werden existenzielle Risiken und Jobverluste diskutiert, andererseits behaupten führende KI-Labore bereits zu wissen, wie AGI skaliert wird. Diese Page fasst aktuelle Narrative, Trends und deren …

Spezialisierte Frontier-Modelle und Multimodal

News-Wiki · 28.04.2026

## Überblick Spezialisierte Frontier-Modelle sind hochperformante Large Language Models und Multimodal-Modelle, die für spezifische Domänen oder Anwendungsbereiche optimiert wurden. Sie bauen auf Frontier-Technologie auf, sind aber nicht universell einsetzbar, sondern für konkrete Problemräume (Wissenschaft, Cybersecurity, …

KI-Governance und verantwortungsvoller Einsatz

News-Wiki · 28.04.2026

## Überblick KI-Governance beschreibt Regelwerke, Richtlinien und Kontrollmechanismen, die den Einsatz von KI-Systemen lenken – insbesondere in sicherheitskritischen und hochsensiblen Bereichen. Die Branche balanciert dabei zwischen innovativen Anwendungen und Risikominderung. ## Controlled Access und spezialisierte …

Strategische Partnerschaften und Lizenzmodelle

News-Wiki · 28.04.2026

## Übersicht Strategische Partnerschaften und Lizenzmodelle prägen die Verfügbarkeit von KI-Modellen und APIs für Entwickler:innen. Sie beeinflussen, über welche Cloud-Infrastruktur Modelle zugänglich sind, welche kommerziellen Rechte Partner haben und wie Unternehmen ihre technologischen Kapazitäten bündeln. …

KI-Benchmarks, Modellvergleiche und Trends

News-Wiki · 28.04.2026

## Überblick KI-Benchmarks sind zentral für die Evaluierung und den Vergleich von Language Models. Sie dienen Entwickler:innen zur Modellauswahl, Leistungsmessung und zum Tracking technologischer Fortschritte. Allerdings geraten traditionelle Benchmark-Methoden zunehmend an ihre Grenzen – insbesondere …

Evaluator Bias – LLM-Evaluator-Bias und Bewertungsprobleme

News-Wiki · 28.04.2026

## Überblick Die Verwendung von LLMs als automatische Evaluatoren für Model-Outputs ist verbreitet, aber anfällig für systematische Verzerrungen. Diese Biases beeinflussen Model-Rankings, Leaderboards und Quality-Control-Systeme und können zu fehlerhaften Schlussfolgerungen über Model-Performance führen. ## Self-Preference …

Developer Resources und Community

News-Wiki · 28.04.2026

## Überblick Sammlung von Ressourcen, Communities und Tutorials für Entwickler:innen im Bereich [Agents](/wiki/agents/). Hier finden sich Guides, Newsletter, Dokumentationen und Austauschplattformen. ## Newsletter und Kurationen ### Simon Willison's Newsletter Wöchentlicher Newsletter mit Kuratierung aktueller KI-News …

Agent-Anwendungen in Produktion

News-Wiki · 28.04.2026

## Übersicht Agent-Anwendungen in Produktion beschreiben den Einsatz autonomer [KI-Agenten](/wiki/agents/agent-grundlagen/) in realen Geschäftsprozessen und kritischen Systemen. Der Fokus liegt auf Architektur, Integration, Performance und bewährten Praktiken für skalierbare, zuverlässige Agenten-Systeme. ## Harness Engineering: Beyond Prompt …

Developer Tools & Libraries

News-Wiki · 27.04.2026

## Claude-spezifische Tools **Claude System-Prompts als Git-Timeline** Anthropic veröffentlicht die System-Prompts für Claude-Modelle. Ein Entwickler hat diese in ein GitHub-Repository mit Fake-Commit-Daten konvertiert, um Änderungen zwischen Versionen nachverfolgbar zu machen (z.B. Opus 4.6 → 4.7). …

Agent Frameworks & Orchestrierung

News-Wiki · 27.04.2026

## Überblick Agent Frameworks sind Plattformen und Libraries zur Entwicklung, Orchestrierung und Deployment von autonomen Agenten. Sie abstrahieren die Komplexität von Multi-Step-Reasoning, Tool-Integration und Workflow-Management und ermöglichen es Entwickler:innen, handlungsfähige KI-Systeme zu bauen, die über …

Frontier Models & LLM Releases

News-Wiki · 27.04.2026

## Übersicht Frontier Models sind die leistungsstärksten Large Language Models, die von Forschungs- und Produktionsunternehmen entwickelt werden. Sie setzen den aktuellen Stand der Technik und dienen als Baseline für neue Capabilities und Optimierungen. Das Spektrum …

Sicherheit und Alignment von LLMs

News-Wiki · 27.04.2026

## Überblick Sicherheit und Alignment beschreiben die Herausforderung, KI-Systeme – insbesondere große Sprachmodelle – so zu gestalten und zu trainieren, dass sie zuverlässig den Absichten ihrer Betreiber entsprechen und nicht zu Manipulation, Täuschung oder unkontrolliertem …

Agent-Systeme: Autonome Agenten und Multi-Agent-Systeme

News-Wiki · 27.04.2026

## Überblick Agent-Systeme sind KI-basierte Systeme, die autonom Entscheidungen treffen, Tools nutzen und längerfristige Aufgaben in komplexen Umgebungen verfolgen. Der Fokus liegt auf Reasoning, Tool-Integration, Memory und Koordination in Multi-Agent-Settings. Aktuelle Forschung zeigt, dass spezialisierte …

Modell-Benchmarking und Leistungsvergleiche

News-Wiki · 27.04.2026

## Übersicht Modell-Benchmarking ist zentral für die Evaluierung von Large Language Models (LLMs) – doch die Aussagekraft von Standardbenchmarks wird zunehmend infrage gestellt. Mit schneller iterierenden Modellveröffentlichungen offenbaren sich erhebliche Lücken zwischen Benchmark-Performance und praktischen …

Open-Source-Modelle, Robotik und Post-Training

News-Wiki · 27.04.2026

## Überblick Open-Source-Modelle und -Frameworks ermöglichen es Entwickler:innen, KI-Systeme jenseits von reinen Sprachmodellen zu bauen: von Robotik-Anwendungen über Speech-to-Text bis zu Custom-LLM-Training. Das Ökosystem wächst mit stabilen, produktionsreifen Tools und erweitert sich kontinuierlich um On-Device-optimierte …

Agent-Frameworks und Autonome Systeme

News-Wiki · 27.04.2026

## Überblick Agenten-Frameworks sind Plattformen und Toolkits zur Entwicklung, Deployment und Verwaltung autonomer KI-Agenten. Sie integrieren [LLM](/wiki/product/language-models/)-Modelle mit externen Tools, APIs und Workflows, um komplexe Aufgaben zu automatisieren. Der Trend bewegt sich von User-Interface-Automatisierung (RPA) …

Claude-Serie (Claude-Serie und Anthropic-Entwicklungen)

News-Wiki · 27.04.2026

## Überblick Die Claude-Serie sind Large Language Models von [Anthropic](/wiki/product/anthropic/). Sie bestehen aus verschiedenen Größen (Haiku, Sonnet, Opus) mit unterschiedlichen Performance- und Latenz-Charakteristiken. Die Serie wird regelmäßig aktualisiert; aktuelle Versionen sind Opus 4.7, Sonnet 4.6 …