-
Mehr Code, neue Kosten, neue Risiken: vier KI-Befunde dieser Woche
Blog
· 08.06.2026
KI schreibt immer mehr Code – aber kommt der Mehrwert beim Nutzer an? Vier aktuelle Befunde aus Studie, Industrie und Sicherheit.
-
KI-Woche: Interaction Models, Colossus 1 als Anthropic-Anbau, Refactoring-Benchmarks
News-Wiki
· 15.05.2026
Interaction Models von Thinking Machines brechen mit der Turn-Logik. Anthropic mietet xAIs Colossus-1-Rechenzentrum komplett. Plus: METR-Benchmark stoesst bei 16 Stunden an seine Grenzen, neuer Refactoring-Benchmark misst innere Code-Qualitaet, OpenAI veroeffentlicht Security-Tools im Wochentakt.
-
Wordle auf Deutsch: ein Build-Bericht
Blog
· 13.05.2026
Aus der Frage nach einer deutschen Wortliste wurde an einem Nachmittag ein spielbares Wordle unter /wordle/ — mit informationstheoretischem Solver, KI-Tutor-Anbindung und einem Diagnose-Twist bei der Page-Context-Bridge. Reihenfolge der Schritte und zwei Lektionen aus dem …
-
KI News der Woche: Benchmarks, Pannen und gefundene Lücken (developers club YT channel)
Blog
· 08.05.2026
Zusammenfassung der developers-club-Sendung „KI News“ mit Steve Haupt: eine ruhigere Woche ohne große Releases, dafür mit Lehrstücken zu Benchmark-Pannen und gefundenen Lücken.
-
SubQ: Architektursprung oder Marketing? Eine Analyse
Blog
· 07.05.2026
Ein Startup behauptet, mit dem Modell SubQ den Long-Context-Engpass geknackt zu haben: 12 Millionen Token Kontext, 300-fach billiger als Claude, 52-fach schneller. Eine Analyse der Technical Reports und der Community-Reaktionen — ein Hands-on-Test steht noch …
-
Claude Code: Die Anleitung für Nicht-Programmierer
Blog
· 06.05.2026
Claude Code arbeitet direkt auf deinem Rechner: legt Dateien an, bearbeitet sie, führt Befehle aus, behebt Fehler — gesteuert per deutscher Beschreibung. Eine Schritt-für-Schritt-Anleitung ohne Programmiervorkenntnisse.
-
Browser-MCP-Server
Glossar
· 02.05.2026
## Definition Ein **Browser-MCP-Server** ist eine Variante eines [[MCP|MCP-Servers]], die Tools bereitstellt, die nur im Browser-Kontext Sinn ergeben — Lese-/Schreib-Zugriff auf den DOM, Local-Storage, Geolocation, Clipboard etc. Der LLM-Host kann damit *die Seite veraendern*, auf …
-
MCP (Model Context Protocol)
Glossar
· 02.05.2026
## Definition [[MCP]] (Model Context Protocol) ist Anthropics offener Standard fuer LLM-Tool-Kopplung. Statt jedes Werkzeug im Modell selbst zu kodieren, beschreibt ein **MCP-Server** seine Faehigkeiten als JSON-Schema; ein **MCP-Client** vermittelt zwischen LLM-Host und Server ueber …
-
Claude Code: Praktische Anwendungen & Tutorials
News-Wiki
· 30.04.2026
Claude Code ist Anthropics AI-gestütztes Coding- und Automatisierungs-Tool. Diese Seite sammelt praktische Tutorials, Setups und Entscheidungshilfen für konkrete Anwendungsfälle – von lokalen Homelab-Setups bis zu Browser-Automatisierung und Knowledge-Management. ## Lokale Infrastruktur & Hardware-Setup ### DIY-Homeserver …
-
Interpretierbarkeit und Transformer-Architektur
News-Wiki
· 30.04.2026
## Überblick Interpretierbarkeit von Transformer-Modellen beschreibt die Fähigkeit, Entscheidungen und interne Repräsentationen nachvollziehbar zu machen. Dies umfasst die Analyse von Aktivierungsmustern, die Verfolgung von Fehlerquellen und das Verständnis, wie Architektur-Entscheidungen die Lesbarkeit von Modell-Behavior beeinflussen. …
-
Risiken bei interner Frontier-Modell-Nutzung
News-Wiki
· 30.04.2026
## Übersicht Organisationen, die Frontier-Modelle intern nutzen – entweder zur Skalierung von Entwicklung, zur Datenverarbeitung oder als Basis für weitere Systeme – sehen sich mit mehreren Risiken konfrontiert. Diese reichen von Abhängigkeitsrisiken über Sicherheitsbedenken bis …
-
AI-Coding-Agenten & Code-Generierung
News-Wiki
· 30.04.2026
## Überblick AI-Coding-Agenten sind autonome Systeme, die Softwareentwicklung teilweise oder vollständig automatisieren. Sie kombinieren Large Language Models mit Code-Ausführung, Testing und iterativer Optimierung. Die Entwicklung bewegt sich von Ad-hoc-Prompting hin zu strukturierten, produktionsreifen Frameworks. ## …
-
Anthropic Geschäftszahlen und Marktposition
News-Wiki
· 30.04.2026
## Überblick Anthropic ist ein führendes KI-Sicherheitsunternehmen, das sich auf die Entwicklung großer Sprachmodelle (insbesondere die Claude-Familie) konzentriert. Das Unternehmen hat in den letzten Jahren signifikantes Wachstum und eine starke Marktposition aufgebaut. ## Finanzielle Kennzahlen …
-
Infrastruktur-Deployment (KI-Infrastruktur und Deployment)
News-Wiki
· 30.04.2026
## Übersicht Infrastruktur und Deployment sind zentrale Enabler für die praktische Nutzung von [Frontier-Modellen](/wiki/frontier-models/). Die Entscheidung zwischen lokaler Inferenz, Cloud-APIs und eigenem Datacenter-Betrieb wird durch Kosten, Verfügbarkeit und Performance-Anforderungen bestimmt. Die aktuelle Landschaft spaltet sich …
-
Spezialisierte Agent-Anwendungen
News-Wiki
· 30.04.2026
## Überblick Spezialisierte Agent-Anwendungen nutzen [KI-Agenten](/wiki/agents/grundlagen/) für domänenspezifische Aufgaben: Produktentwicklung, Marktforschung, wissenschaftliche Forschung, persönliches Wissensmanagement und Enterprise-Automation. Diese Anwendungen gehen über generische Chatbots hinaus und adressieren konkrete Business- oder Forschungsprobleme. ## Persönliches Wissensmanagement **KI-Second-Brain mit …
-
Agent-Modelle und Frontier-Leistung
News-Wiki
· 30.04.2026
## Überblick Agent-Modelle sind Sprachmodelle, die speziell für autonome, mehrstufige Aufgaben durch Tool-Use und Selbstüberwachung optimiert sind. Die Frontier-Entwicklung bewegt sich hin zu agentenbasierten Architekturen als Mainstream-Feature, nicht als Spezialisierung. ## Aktuelle Frontier-Modelle ### OpenAI …
-
Coding-Agenten in Produktion
News-Wiki
· 30.04.2026
## Überblick Coding-Agenten sind KI-Systeme, die autonome Softwareentwicklung durchführen: von Planung und Implementierung über Testing bis zum Deployment. Der Produktionseinsatz erfordert spezialisierte Architekturen, die zuverlässigkeit durch Validierungsschichten, Multi-Agent-Koordination und deterministische Kontrollmechanismen erhöhen statt auf einzelne …
-
KI-gestützte Design- und UI-Tools
News-Wiki
· 29.04.2026
## Übersicht KI-gestützte Design-Tools automatisieren und beschleunigen UI/UX-Design, Prototyping und visuelle Asset-Generierung. Sie nutzen [Language Models](/wiki/core/language-models/), [Agenten](/wiki/core/agents/) und Code-Generierung für schnelle Iteration von Designs bis zur Implementierung. ## Hauptlösungen ### Google Stitch Google Labs' Stitch …
-
Production AI Infrastructure & Harness Engineering
News-Wiki
· 29.04.2026
## Übersicht Production AI Infrastructure beschreibt die technische Basis für zuverlässige, skalierbare und wartbare KI-Systeme in Produktionsumgebungen. Der Begriff **Harness Engineering** fasst die Verschiebung weg von klassischem [Prompt Engineering](/wiki/llm/prompt-engineering/) hin zu durchdachten Engineering-Systemen zusammen: robuste …
-
Mehrsprachige NLP & Non-Englische Modelle
News-Wiki
· 29.04.2026
## Überblick Mehrsprachige NLP-Modelle und nicht-englische Large Language Models (LLMs) schließen eine wichtige Lücke in der KI-Landschaft. Während englischsprachige Modelle dominieren, wächst die Anzahl qualitativ hochwertiger Modelle für andere Sprachen kontinuierlich. ## Evaluation & Benchmarking …
-
Infrastruktur-Ökonomie & Marktstrategien
News-Wiki
· 29.04.2026
## Überblick Die Ökonomie der KI-Infrastruktur wird zunehmend zum strategischen Wettbewerbsfaktor. Während etablierte Western Labs (Google, Anthropic, Microsoft, Amazon, OpenAI) durch massive Kapitalinvestitionen Skalierungsvorteile aufbauen, verschieben neue Marktteilnehmer wie DeepSeek das Gleichgewicht durch Fokus auf …
-
Multimodale und Vision-Modelle
News-Wiki
· 29.04.2026
## Überblick Multimodale Modelle verarbeiten mehrere Eingabetypen (Text, Bilder, Audio, Video) gleichzeitig und erzeugen Ausgaben basierend auf der kombinierten Analyse. Vision-Modelle spezialisieren sich auf Bild- und Videoanalyse. Diese Klasse ist zentral für praktische Anwendungen wie …
-
KI-Narrative und Trends
News-Wiki
· 28.04.2026
## Überblick Die KI-Landschaft wird von widersprechenden Narrativen geprägt: Einerseits werden existenzielle Risiken und Jobverluste diskutiert, andererseits behaupten führende KI-Labore bereits zu wissen, wie AGI skaliert wird. Diese Page fasst aktuelle Narrative, Trends und deren …
-
Spezialisierte Frontier-Modelle und Multimodal
News-Wiki
· 28.04.2026
## Überblick Spezialisierte Frontier-Modelle sind hochperformante Large Language Models und Multimodal-Modelle, die für spezifische Domänen oder Anwendungsbereiche optimiert wurden. Sie bauen auf Frontier-Technologie auf, sind aber nicht universell einsetzbar, sondern für konkrete Problemräume (Wissenschaft, Cybersecurity, …
-
KI-Governance und verantwortungsvoller Einsatz
News-Wiki
· 28.04.2026
## Überblick KI-Governance beschreibt Regelwerke, Richtlinien und Kontrollmechanismen, die den Einsatz von KI-Systemen lenken – insbesondere in sicherheitskritischen und hochsensiblen Bereichen. Die Branche balanciert dabei zwischen innovativen Anwendungen und Risikominderung. ## Controlled Access und spezialisierte …
-
Strategische Partnerschaften und Lizenzmodelle
News-Wiki
· 28.04.2026
## Übersicht Strategische Partnerschaften und Lizenzmodelle prägen die Verfügbarkeit von KI-Modellen und APIs für Entwickler:innen. Sie beeinflussen, über welche Cloud-Infrastruktur Modelle zugänglich sind, welche kommerziellen Rechte Partner haben und wie Unternehmen ihre technologischen Kapazitäten bündeln. …
-
KI-Benchmarks, Modellvergleiche und Trends
News-Wiki
· 28.04.2026
## Überblick KI-Benchmarks sind zentral für die Evaluierung und den Vergleich von Language Models. Sie dienen Entwickler:innen zur Modellauswahl, Leistungsmessung und zum Tracking technologischer Fortschritte. Allerdings geraten traditionelle Benchmark-Methoden zunehmend an ihre Grenzen – insbesondere …
-
Evaluator Bias – LLM-Evaluator-Bias und Bewertungsprobleme
News-Wiki
· 28.04.2026
## Überblick Die Verwendung von LLMs als automatische Evaluatoren für Model-Outputs ist verbreitet, aber anfällig für systematische Verzerrungen. Diese Biases beeinflussen Model-Rankings, Leaderboards und Quality-Control-Systeme und können zu fehlerhaften Schlussfolgerungen über Model-Performance führen. ## Self-Preference …
-
Developer Resources und Community
News-Wiki
· 28.04.2026
## Überblick Sammlung von Ressourcen, Communities und Tutorials für Entwickler:innen im Bereich [Agents](/wiki/agents/). Hier finden sich Guides, Newsletter, Dokumentationen und Austauschplattformen. ## Newsletter und Kurationen ### Simon Willison's Newsletter Wöchentlicher Newsletter mit Kuratierung aktueller KI-News …
-
Agent-Anwendungen in Produktion
News-Wiki
· 28.04.2026
## Übersicht Agent-Anwendungen in Produktion beschreiben den Einsatz autonomer [KI-Agenten](/wiki/agents/agent-grundlagen/) in realen Geschäftsprozessen und kritischen Systemen. Der Fokus liegt auf Architektur, Integration, Performance und bewährten Praktiken für skalierbare, zuverlässige Agenten-Systeme. ## Harness Engineering: Beyond Prompt …
-
Developer Tools & Libraries
News-Wiki
· 27.04.2026
## Claude-spezifische Tools **Claude System-Prompts als Git-Timeline** Anthropic veröffentlicht die System-Prompts für Claude-Modelle. Ein Entwickler hat diese in ein GitHub-Repository mit Fake-Commit-Daten konvertiert, um Änderungen zwischen Versionen nachverfolgbar zu machen (z.B. Opus 4.6 → 4.7). …
-
Agent Frameworks & Orchestrierung
News-Wiki
· 27.04.2026
## Überblick Agent Frameworks sind Plattformen und Libraries zur Entwicklung, Orchestrierung und Deployment von autonomen Agenten. Sie abstrahieren die Komplexität von Multi-Step-Reasoning, Tool-Integration und Workflow-Management und ermöglichen es Entwickler:innen, handlungsfähige KI-Systeme zu bauen, die über …
-
Frontier Models & LLM Releases
News-Wiki
· 27.04.2026
## Übersicht Frontier Models sind die leistungsstärksten Large Language Models, die von Forschungs- und Produktionsunternehmen entwickelt werden. Sie setzen den aktuellen Stand der Technik und dienen als Baseline für neue Capabilities und Optimierungen. Das Spektrum …
-
Sicherheit und Alignment von LLMs
News-Wiki
· 27.04.2026
## Überblick Sicherheit und Alignment beschreiben die Herausforderung, KI-Systeme – insbesondere große Sprachmodelle – so zu gestalten und zu trainieren, dass sie zuverlässig den Absichten ihrer Betreiber entsprechen und nicht zu Manipulation, Täuschung oder unkontrolliertem …
-
Agent-Systeme: Autonome Agenten und Multi-Agent-Systeme
News-Wiki
· 27.04.2026
## Überblick Agent-Systeme sind KI-basierte Systeme, die autonom Entscheidungen treffen, Tools nutzen und längerfristige Aufgaben in komplexen Umgebungen verfolgen. Der Fokus liegt auf Reasoning, Tool-Integration, Memory und Koordination in Multi-Agent-Settings. Aktuelle Forschung zeigt, dass spezialisierte …
-
Modell-Benchmarking und Leistungsvergleiche
News-Wiki
· 27.04.2026
## Übersicht Modell-Benchmarking ist zentral für die Evaluierung von Large Language Models (LLMs) – doch die Aussagekraft von Standardbenchmarks wird zunehmend infrage gestellt. Mit schneller iterierenden Modellveröffentlichungen offenbaren sich erhebliche Lücken zwischen Benchmark-Performance und praktischen …
-
Open-Source-Modelle, Robotik und Post-Training
News-Wiki
· 27.04.2026
## Überblick Open-Source-Modelle und -Frameworks ermöglichen es Entwickler:innen, KI-Systeme jenseits von reinen Sprachmodellen zu bauen: von Robotik-Anwendungen über Speech-to-Text bis zu Custom-LLM-Training. Das Ökosystem wächst mit stabilen, produktionsreifen Tools und erweitert sich kontinuierlich um On-Device-optimierte …
-
Agent-Frameworks und Autonome Systeme
News-Wiki
· 27.04.2026
## Überblick Agenten-Frameworks sind Plattformen und Toolkits zur Entwicklung, Deployment und Verwaltung autonomer KI-Agenten. Sie integrieren [LLM](/wiki/product/language-models/)-Modelle mit externen Tools, APIs und Workflows, um komplexe Aufgaben zu automatisieren. Der Trend bewegt sich von User-Interface-Automatisierung (RPA) …
-
Claude-Serie (Claude-Serie und Anthropic-Entwicklungen)
News-Wiki
· 27.04.2026
## Überblick Die Claude-Serie sind Large Language Models von [Anthropic](/wiki/product/anthropic/). Sie bestehen aus verschiedenen Größen (Haiku, Sonnet, Opus) mit unterschiedlichen Performance- und Latenz-Charakteristiken. Die Serie wird regelmäßig aktualisiert; aktuelle Versionen sind Opus 4.7, Sonnet 4.6 …
-
Python CLI Tools & Plugins
News-Wiki
· 27.04.2026
## Übersicht Spezialisierte Command-Line-Tools und Plugins für Python-Entwickler im KI-Bereich. Diese Tools verbessern den Workflow beim lokalen Arbeiten mit [LLMs](/wiki/open-source/llms/), API-Integration und Prompt-Engineering. ## Hauptwerkzeuge ### llm – Universelles CLI-Tool für LLMs Zentrales Open-Source-Tool zum …
-
Sicherheit und Compliance
News-Wiki
· 27.04.2026
## Überblick Sicherheit und Compliance sind zentrale Aspekte bei der Entwicklung und dem Einsatz von KI-Systemen. Dieser Bereich behandelt: - Supply-Chain-Sicherheit und Tooling-Risiken - Modell-Schutz und Distillations-Angriffe - Responsible Deployment in sicherheitskritischen Kontexten - Zugriffskontrolle …
-
Infrastruktur-Investitionen in KI
News-Wiki
· 27.04.2026
## Überblick KI-Infrastruktur ist zur kritischen Ressource geworden. Tech-Konzerne investieren Dutzende Milliarden Dollar in Rechenzentren, Custom-Hardware und Modell-Entwicklung. Dies prägt die Verfügbarkeit von Modellen, deren Trainings-Bedingungen und die langfristige Wettbewerbsfähigkeit verschiedener Plattformen. Die Skalierbarkeit hängt …
-
KI-Agenten im Enterprise: Strategien, Technologie und Marktdynamik
News-Wiki
· 27.04.2026
## Überblick KI-Agenten im Enterprise-Kontext markieren eine neue Phase der KI-Anwendung: autonome oder semi-autonome Systeme, die komplexe Aufgaben in produktiven Umgebungen ausführen. Der Markt wird von OpenAI, Anthropic, Google und Meta dominiert, die jeweils unterschiedliche …
-
Claude-Entwicklung
News-Wiki
· 27.04.2026
## Übersicht Claude ist die Modell-Familie von [Anthropic](/wiki/labs/anthropic/). Die Seite dokumentiert aktuelle Entwicklungen, Modellversionen, Sicherheitsaspekte und Tooling rund um Claude. ## Modellversionen ### Claude Opus - **Opus 4.6**: Baseline-Version mit dokumentierten System-Prompts - **Opus 4.7** …
-
Claude und Anthropic Entwicklungen
News-Wiki
· 27.04.2026
## Überblick Anthropic ist einer der führenden [Frontier-Model](/wiki/frontier-models/overview/)-Anbieter mit Fokus auf Sicherheit und Skalierung. Das Flaggschiff Claude wird kontinuierlich erweitert und konkurriert direkt mit [OpenAI's ChatGPT und GPT-Modellen](/wiki/frontier-models/openai-gpt/). Durch massive Kapitalzuführungen (Google 40 Mrd. Dollar, …
-
Konferenzen und Workshops
News-Wiki
· 27.04.2026
## Überblick Wichtige Konferenzen und Workshops zum Thema KI, mit Fokus auf Python-basierte Entwicklung und praktische Anwendungen. ## Kommende Events ### PyCon US 2026 - **Termin:** 13.–19. Mai 2026 - **Ort:** Long Beach, Kalifornien - …
-
Marktstrategien und strategische Partnerschaften im Enterprise-LLM-Markt
News-Wiki
· 27.04.2026
## Überblick Der Enterprise-Markt für Large Language Models wird von wenigen dominanten Akteuren geprägt. [OpenAI](/wiki/enterprise/openai) und [Anthropic](/wiki/enterprise/anthropic) sind die beiden führenden Anbieter und verfolgen unterschiedliche strategische Ansätze zur Kundengewinnung und Marktpositionierung. Die Branche durchlebt aktuell …
-
KI-Sicherheit, Compliance und Datenschutz (Enterprise)
News-Wiki
· 27.04.2026
## Übersicht Einsatz von Large Language Models und spezialisierten KI-Systemen für Sicherheitsaufgaben, Compliance-Automatisierung und Datenschutz in Enterprise-Umgebungen. Praktische Anwendungen reichen von Vulnerability-Detection über Cyber-Defense bis zur automatischen Sensitivdaten-Erkennung. Der Trend geht zu spezialisierten Modellen statt …
-
Claude-Modelle (Anthropic Releases)
News-Wiki
· 27.04.2026
## Übersicht Anthropic Claude ist eine Familie von großen Sprachmodellen mit Fokus auf Safety und praktischen Anwendungen. Die aktuellen Top-Modelle sind Claude Opus 4.7, Claude Opus 4.6 und Claude Mythos (Preview), ergänzt durch leichtgewichtige Varianten …
-
GPT-Modelle (OpenAI Flagship-Releases)
News-Wiki
· 27.04.2026
## Übersicht OpenAI-Flaggschiff-Modelle für allgemeine und spezialisierte KI-Aufgaben. Die Produktlinie integriert zunehmend Coding-Fähigkeiten direkt in die Hauptmodelle statt separater Spezialisierungen. Mit GPT-5.5 vollzieht OpenAI die strategische Vereinigung: das dedizierte Codex-Modell wird eingestellt, seine Funktionen landen …