-
Mehr Code, neue Kosten, neue Risiken: vier KI-Befunde dieser Woche
Blog
· 08.06.2026
KI schreibt immer mehr Code – aber kommt der Mehrwert beim Nutzer an? Vier aktuelle Befunde aus Studie, Industrie und Sicherheit.
-
Vibe Coding
Glossar
· 01.06.2026
## Vibe-Coding **Definition.** Vibe-Coding bezeichnet eine konversationsbasierte Form der Softwareentwicklung, bei der die gewünschte Funktionalität in natürlicher Sprache beschrieben und der eigentliche Code von einem KI-Sprachmodell (LLM) erzeugt wird. Die entwickelnde Person steuert, testet und …
-
Coding mit KI (1. Auflage)
Review
· 15.05.2026
*Coding mit KI* (Rheinwerk 2025) von Kofler, Öggl und Springer behandelt den Einsatz von Sprachmodellen in der Softwareentwicklung — solide für den Stand Ende 2024, aus heutiger Sicht in Teilen obsolet.
-
KI-Woche: Interaction Models, Colossus 1 als Anthropic-Anbau, Refactoring-Benchmarks
News-Wiki
· 15.05.2026
Interaction Models von Thinking Machines brechen mit der Turn-Logik. Anthropic mietet xAIs Colossus-1-Rechenzentrum komplett. Plus: METR-Benchmark stoesst bei 16 Stunden an seine Grenzen, neuer Refactoring-Benchmark misst innere Code-Qualitaet, OpenAI veroeffentlicht Security-Tools im Wochentakt.
-
KI News der Woche: Benchmarks, Pannen und gefundene Lücken (developers club YT channel)
Blog
· 08.05.2026
Zusammenfassung der developers-club-Sendung „KI News“ mit Steve Haupt: eine ruhigere Woche ohne große Releases, dafür mit Lehrstücken zu Benchmark-Pannen und gefundenen Lücken.
-
SubQ: Architektursprung oder Marketing? Eine Analyse
Blog
· 07.05.2026
Ein Startup behauptet, mit dem Modell SubQ den Long-Context-Engpass geknackt zu haben: 12 Millionen Token Kontext, 300-fach billiger als Claude, 52-fach schneller. Eine Analyse der Technical Reports und der Community-Reaktionen — ein Hands-on-Test steht noch …
-
Andrej Karpathys Best Practices für AI Coding – kompakt erklärt
Blog
· 07.05.2026
Andrej Karpathy hat auf X seine Coding-Learnings mit AI Agents gepostet. Ein Community-Entwickler hat daraus eine fertige CLAUDE.md gemacht — hier kompakt eingeordnet, was wirklich hilft.
-
Der 8-Phasen-Workflow für KI-Agenten
Blog
· 06.05.2026
Benjamin Thorstensen hat mit einem 8-Phasen-Workflow den OpenAI-Hackathon (5.000 € Preisgeld) gewonnen. Sein Ansatz gegen das klassische Phänomen, dass KI-Agenten nach ein paar Stunden mehr kaputt machen als bauen.
-
Browser-MCP-Server
Glossar
· 02.05.2026
## Definition Ein **Browser-MCP-Server** ist eine Variante eines [[MCP|MCP-Servers]], die Tools bereitstellt, die nur im Browser-Kontext Sinn ergeben — Lese-/Schreib-Zugriff auf den DOM, Local-Storage, Geolocation, Clipboard etc. Der LLM-Host kann damit *die Seite veraendern*, auf …
-
MCP (Model Context Protocol)
Glossar
· 02.05.2026
## Definition [[MCP]] (Model Context Protocol) ist Anthropics offener Standard fuer LLM-Tool-Kopplung. Statt jedes Werkzeug im Modell selbst zu kodieren, beschreibt ein **MCP-Server** seine Faehigkeiten als JSON-Schema; ein **MCP-Client** vermittelt zwischen LLM-Host und Server ueber …
-
vLLM
Glossar
· 01.05.2026
## Definition vLLM ist ein High-Performance-Inference-Server für LLMs, der Batch-Processing und Memory-Optionen (PagedAttention, KV-Cache-Verwaltung) nutzt, um Inference-Durchsatz um ein Vielfaches zu erhöhen und Speicherverbrauch zu senken. Praktiker ersetzen damit langsame, speicherhungrige Standard-Inference durch eine produktionsreife …
-
Agentic Coding & Automation
News-Wiki
· 30.04.2026
## Übersicht Agentic Coding & Automation beschreibt Ansätze und Frameworks, bei denen KI-Agenten Softwareentwicklungsprozesse (von Planning über Code-Generierung bis Testing und Deployment) teilweise oder vollständig autonomisieren. Im Gegensatz zu traditionellen Code-Completion-Tools orchestrieren diese Systeme mehrere …
-
Interpretierbarkeit und Transformer-Architektur
News-Wiki
· 30.04.2026
## Überblick Interpretierbarkeit von Transformer-Modellen beschreibt die Fähigkeit, Entscheidungen und interne Repräsentationen nachvollziehbar zu machen. Dies umfasst die Analyse von Aktivierungsmustern, die Verfolgung von Fehlerquellen und das Verständnis, wie Architektur-Entscheidungen die Lesbarkeit von Modell-Behavior beeinflussen. …
-
Risiken bei interner Frontier-Modell-Nutzung
News-Wiki
· 30.04.2026
## Übersicht Organisationen, die Frontier-Modelle intern nutzen – entweder zur Skalierung von Entwicklung, zur Datenverarbeitung oder als Basis für weitere Systeme – sehen sich mit mehreren Risiken konfrontiert. Diese reichen von Abhängigkeitsrisiken über Sicherheitsbedenken bis …
-
Anthropic Geschäftszahlen und Marktposition
News-Wiki
· 30.04.2026
## Überblick Anthropic ist ein führendes KI-Sicherheitsunternehmen, das sich auf die Entwicklung großer Sprachmodelle (insbesondere die Claude-Familie) konzentriert. Das Unternehmen hat in den letzten Jahren signifikantes Wachstum und eine starke Marktposition aufgebaut. ## Finanzielle Kennzahlen …
-
Frontier-Modelle und Wettbewerb
News-Wiki
· 30.04.2026
## Überblick Der Frontier-Modell-Markt ist stark fragmentiert und wettbewerbsintensiv. Große Akteure wie [OpenAI](/wiki/labs/openai-modelle/), Google und Meta konkurrieren um technologische Führerschaft und Marktanteile. Zusätzlich verändern kostengünstige oder innovative Modelle aus anderen Regionen (etwa China) die Wettbewerbsdynamik …
-
KI-Governance & Autonome Agenten-Identität
News-Wiki
· 30.04.2026
## Überblick KI-Governance-Systeme beschäftigen sich mit Steuerung, Überwachung und Identifikation von [autonomen KI-Agenten](/wiki/infrastructure/ai-agents/). Das Feld behandelt zwei zentrale Fragen: 1. **Automatisierung im Maßstab**: Wie lassen sich KI-gesteuerte Entwicklungs- und Operationsprozesse skalieren? 2. **Agent-Identität & Verifikation**: …
-
Infrastruktur-Deployment (KI-Infrastruktur und Deployment)
News-Wiki
· 30.04.2026
## Übersicht Infrastruktur und Deployment sind zentrale Enabler für die praktische Nutzung von [Frontier-Modellen](/wiki/frontier-models/). Die Entscheidung zwischen lokaler Inferenz, Cloud-APIs und eigenem Datacenter-Betrieb wird durch Kosten, Verfügbarkeit und Performance-Anforderungen bestimmt. Die aktuelle Landschaft spaltet sich …
-
Agent-Modelle und Frontier-Leistung
News-Wiki
· 30.04.2026
## Überblick Agent-Modelle sind Sprachmodelle, die speziell für autonome, mehrstufige Aufgaben durch Tool-Use und Selbstüberwachung optimiert sind. Die Frontier-Entwicklung bewegt sich hin zu agentenbasierten Architekturen als Mainstream-Feature, nicht als Spezialisierung. ## Aktuelle Frontier-Modelle ### OpenAI …
-
Coding-Agenten in Produktion
News-Wiki
· 30.04.2026
## Überblick Coding-Agenten sind KI-Systeme, die autonome Softwareentwicklung durchführen: von Planung und Implementierung über Testing bis zum Deployment. Der Produktionseinsatz erfordert spezialisierte Architekturen, die zuverlässigkeit durch Validierungsschichten, Multi-Agent-Koordination und deterministische Kontrollmechanismen erhöhen statt auf einzelne …
-
Agent-Architektur und Design-Patterns
News-Wiki
· 29.04.2026
## Überblick Agent-Architekturen definieren, wie KI-Agenten strukturiert werden – von der Kernlogik bis zur produktiven Ausführung. Die Architektur-Entscheidungen beeinflussen Skalierbarkeit, Zuverlässigkeit und Wartbarkeit erheblich. Eine gute Agent-Architektur trennt **Kernlogik** (Reasoning, Tool-Calls, Prompting) von **Produktions-Framework** (State …
-
Production AI Infrastructure & Harness Engineering
News-Wiki
· 29.04.2026
## Übersicht Production AI Infrastructure beschreibt die technische Basis für zuverlässige, skalierbare und wartbare KI-Systeme in Produktionsumgebungen. Der Begriff **Harness Engineering** fasst die Verschiebung weg von klassischem [Prompt Engineering](/wiki/llm/prompt-engineering/) hin zu durchdachten Engineering-Systemen zusammen: robuste …
-
Spezialisierte Frontier-Modelle
News-Wiki
· 29.04.2026
Spezialisierte Frontier-Modelle sind hochperformante Sprachmodelle, die auf spezifische Domänen oder Aufgaben optimiert wurden, während sie die technischen Eigenschaften von [Frontier-Modellen](/wiki/frontier-models/) beibehalten. Sie kombinieren State-of-the-Art-Reasoning mit Fachspezialiserung. ## Multimodale Spezialmodelle **NVIDIA Nemotron 3 Nano Omni** (2026) …
-
Enterprise-AI-Adoption und praktische Anwendungsfälle
News-Wiki
· 29.04.2026
## Überblick Enterprise-AI-Adoption beschreibt die systematische Einführung und Skalierung von KI-Systemen in Großunternehmen. Der Fokus liegt auf praktischen Anwendungsfällen, Infrastruktur und organisatorischen Herausforderungen bei der produktiven Integration von KI-Modellen in bestehende Geschäftsprozesse. Zunehmend spielen autonome …
-
Bildgenerierung und Multimodale Bildverarbeitung
News-Wiki
· 29.04.2026
## Überblick Bildgenerierung ist ein zentraler Bereich der [Multimodal-KI](/wiki/multimodal/), bei dem Sprachmodelle visuellen Output aus Textbeschreibungen (Prompts) erzeugen. Moderne Modelle kombinieren Text-zu-Bild-Generierung mit fortgeschrittener Bildverarbeitung und multimodalen Fähigkeiten wie Visual Reasoning und Multilingual-Support. ## Aktuelle …
-
Infrastruktur-Ökonomie & Marktstrategien
News-Wiki
· 29.04.2026
## Überblick Die Ökonomie der KI-Infrastruktur wird zunehmend zum strategischen Wettbewerbsfaktor. Während etablierte Western Labs (Google, Anthropic, Microsoft, Amazon, OpenAI) durch massive Kapitalinvestitionen Skalierungsvorteile aufbauen, verschieben neue Marktteilnehmer wie DeepSeek das Gleichgewicht durch Fokus auf …
-
Multimodale und Vision-Modelle
News-Wiki
· 29.04.2026
## Überblick Multimodale Modelle verarbeiten mehrere Eingabetypen (Text, Bilder, Audio, Video) gleichzeitig und erzeugen Ausgaben basierend auf der kombinierten Analyse. Vision-Modelle spezialisieren sich auf Bild- und Videoanalyse. Diese Klasse ist zentral für praktische Anwendungen wie …
-
Codex Platform & Autonome Systeme
News-Wiki
· 28.04.2026
## Überblick Die Codex Platform umfasst Tools, Frameworks und Infrastruktur-Patterns zur Entwicklung autonomer Systeme – insbesondere Agent-basierte Workflows, Multi-Agent-Systeme und interaktive Trainingsumgebungen. Der Fokus liegt auf Performance-Optimierungen, dezentraler Architektur und Accessibility für Standard-Hardware. ## Agent-Workflows …
-
KI-Narrative und Trends
News-Wiki
· 28.04.2026
## Überblick Die KI-Landschaft wird von widersprechenden Narrativen geprägt: Einerseits werden existenzielle Risiken und Jobverluste diskutiert, andererseits behaupten führende KI-Labore bereits zu wissen, wie AGI skaliert wird. Diese Page fasst aktuelle Narrative, Trends und deren …
-
Enterprise-Adoption und praktische Anwendungen
News-Wiki
· 28.04.2026
## Überblick Enterprise-Adoption von KI und LLMs zeigt sich in zunehmend produktiven Anwendungen. Großunternehmen setzen Frontier-Modelle und [KI-Agenten](/wiki/product/ki-agenten/) systematisch zur Automatisierung von Geschäftsprozessen ein – von Logistik bis zur Softwareentwicklung. Agent-getriebene Workflows werden zum Mainstream-Feature …
-
Spezialisierte Frontier-Modelle und Multimodal
News-Wiki
· 28.04.2026
## Überblick Spezialisierte Frontier-Modelle sind hochperformante Large Language Models und Multimodal-Modelle, die für spezifische Domänen oder Anwendungsbereiche optimiert wurden. Sie bauen auf Frontier-Technologie auf, sind aber nicht universell einsetzbar, sondern für konkrete Problemräume (Wissenschaft, Cybersecurity, …
-
KI-Governance und verantwortungsvoller Einsatz
News-Wiki
· 28.04.2026
## Überblick KI-Governance beschreibt Regelwerke, Richtlinien und Kontrollmechanismen, die den Einsatz von KI-Systemen lenken – insbesondere in sicherheitskritischen und hochsensiblen Bereichen. Die Branche balanciert dabei zwischen innovativen Anwendungen und Risikominderung. ## Controlled Access und spezialisierte …
-
Autonome Agenten & Agentic AI (Open-Source)
News-Wiki
· 28.04.2026
## Überblick Autonome Agenten und Agentic AI beschreiben Systeme, die eigenständig Ziele verfolgen, Aufgaben planen und zielgerichtet handeln – typischerweise auf Basis von [Large Language Models](/wiki/llm-foundation/). Im Open-Source-Ökosystem entstehen spezialisierte Modelle, Frameworks und Werkzeuge für …
-
Strategische Partnerschaften und Lizenzmodelle
News-Wiki
· 28.04.2026
## Übersicht Strategische Partnerschaften und Lizenzmodelle prägen die Verfügbarkeit von KI-Modellen und APIs für Entwickler:innen. Sie beeinflussen, über welche Cloud-Infrastruktur Modelle zugänglich sind, welche kommerziellen Rechte Partner haben und wie Unternehmen ihre technologischen Kapazitäten bündeln. …
-
Evaluator Bias – LLM-Evaluator-Bias und Bewertungsprobleme
News-Wiki
· 28.04.2026
## Überblick Die Verwendung von LLMs als automatische Evaluatoren für Model-Outputs ist verbreitet, aber anfällig für systematische Verzerrungen. Diese Biases beeinflussen Model-Rankings, Leaderboards und Quality-Control-Systeme und können zu fehlerhaften Schlussfolgerungen über Model-Performance führen. ## Self-Preference …
-
Agent-Anwendungen in Produktion
News-Wiki
· 28.04.2026
## Übersicht Agent-Anwendungen in Produktion beschreiben den Einsatz autonomer [KI-Agenten](/wiki/agents/agent-grundlagen/) in realen Geschäftsprozessen und kritischen Systemen. Der Fokus liegt auf Architektur, Integration, Performance und bewährten Praktiken für skalierbare, zuverlässige Agenten-Systeme. ## Harness Engineering: Beyond Prompt …
-
Codex: Agent-Framework & Automatisierung
News-Wiki
· 27.04.2026
## Überblick Codex ist ein Agent-Framework von OpenAI für die Entwicklung autonomer Agenten, die Aufgaben automatisiert ausführen können. Es kombiniert Code-Generierung mit strukturierten Workflows und Tool-Integration. Typische Anwendungen sind automatisierte Datenverarbeitung, Report-Generierung und Integration in …
-
AI Safety & Security
News-Wiki
· 27.04.2026
Werkzeuge, Praktiken und Standards zur Sicherung von KI-Systemen gegen Missbrauch, Datenleaks und compliance-Verletzungen. ## PII-Erkennung und Redaktion **OpenAI Privacy Filter** – Open-Weight-Modell für automatische Erkennung und Maskierung von persönlich identifizierbaren Informationen (PII) in Texten. State-of-the-Art-Genauigkeit …
-
Developer Tools & Libraries
News-Wiki
· 27.04.2026
## Claude-spezifische Tools **Claude System-Prompts als Git-Timeline** Anthropic veröffentlicht die System-Prompts für Claude-Modelle. Ein Entwickler hat diese in ein GitHub-Repository mit Fake-Commit-Daten konvertiert, um Änderungen zwischen Versionen nachverfolgbar zu machen (z.B. Opus 4.6 → 4.7). …
-
Agent Frameworks & Orchestrierung
News-Wiki
· 27.04.2026
## Überblick Agent Frameworks sind Plattformen und Libraries zur Entwicklung, Orchestrierung und Deployment von autonomen Agenten. Sie abstrahieren die Komplexität von Multi-Step-Reasoning, Tool-Integration und Workflow-Management und ermöglichen es Entwickler:innen, handlungsfähige KI-Systeme zu bauen, die über …
-
Frontier Models & LLM Releases
News-Wiki
· 27.04.2026
## Übersicht Frontier Models sind die leistungsstärksten Large Language Models, die von Forschungs- und Produktionsunternehmen entwickelt werden. Sie setzen den aktuellen Stand der Technik und dienen als Baseline für neue Capabilities und Optimierungen. Das Spektrum …
-
Modell-Benchmarking und Leistungsvergleiche
News-Wiki
· 27.04.2026
## Übersicht Modell-Benchmarking ist zentral für die Evaluierung von Large Language Models (LLMs) – doch die Aussagekraft von Standardbenchmarks wird zunehmend infrage gestellt. Mit schneller iterierenden Modellveröffentlichungen offenbaren sich erhebliche Lücken zwischen Benchmark-Performance und praktischen …
-
Developer-Tools und Praktiken
News-Wiki
· 27.04.2026
## Überblick Developer-Tools im KI-Kontext umfassen Code-Assistenten, APIs, lokale Modelle und Best-Practices beim Prompt Engineering. Der Markt verschiebt sich zunehmend zu agentic workflows, On-Device-Verarbeitung für bessere Latenz und Datenschutz, sowie zu Headless-Architekturen, die APIs über …
-
Codex und Bildgenerierung
News-Wiki
· 27.04.2026
## Überblick Codex ist OpenAIs spezialisierter KI-Assistent für Code mit integrierten Bildgenerierungs- und Automatisierungsfunktionen. Mit über 4 Millionen wöchentlich aktiven Nutzern hat sich das Tool zum Produktiv-Standard in Entwickler-Workflows etabliert. OpenAI positioniert Codex zunehmend als …
-
Agent-Frameworks und Autonome Systeme
News-Wiki
· 27.04.2026
## Überblick Agenten-Frameworks sind Plattformen und Toolkits zur Entwicklung, Deployment und Verwaltung autonomer KI-Agenten. Sie integrieren [LLM](/wiki/product/language-models/)-Modelle mit externen Tools, APIs und Workflows, um komplexe Aufgaben zu automatisieren. Der Trend bewegt sich von User-Interface-Automatisierung (RPA) …
-
Claude-Serie (Claude-Serie und Anthropic-Entwicklungen)
News-Wiki
· 27.04.2026
## Überblick Die Claude-Serie sind Large Language Models von [Anthropic](/wiki/product/anthropic/). Sie bestehen aus verschiedenen Größen (Haiku, Sonnet, Opus) mit unterschiedlichen Performance- und Latenz-Charakteristiken. Die Serie wird regelmäßig aktualisiert; aktuelle Versionen sind Opus 4.7, Sonnet 4.6 …
-
gpt-series (GPT-Serie und OpenAI-Modelle)
News-Wiki
· 27.04.2026
Die **GPT-Serie** umfasst die Hauptmodelle und spezialisierten Varianten von OpenAI. Sie repräsentiert die Entwicklungslinie von allgemeinen Large Language Models bis zu domänenspezifischen Frontier-Modellen. ## Hauptmodelle ### GPT-5.5 **GPT-5.5** ist das aktuelle Flagship-Modell mit agentenbasierten Fähigkeiten. …
-
Sicherheits-Tests und Red-Teaming
News-Wiki
· 27.04.2026
## Überblick Sicherheits-Tests und Red-Teaming sind systematische Verfahren zur Identifikation von Schwachstellen in KI-Systemen, bevor diese in produktive Umgebungen gelangen. Sie umfassen strukturierte Angriff-Szenarien, Jailbreak-Versuche und adversariale Evaluierungen. Mit zunehmend komplexeren Modellen werden auch automatisierte …
-
Infrastruktur, Standards & Datenschutz
News-Wiki
· 27.04.2026
## Überblick Dieser Bereich behandelt Infrastruktur-Standards, Best Practices für sichere Modellverwaltung und Datenschutzrichtlinien im Open-Source-KI-Ökosystem. Schwerpunkte: sichere Serialisierung von Modellen, PII-Handling, Dependency-Management, Compliance-Tools und Datenschutz in Trainings- und Deployment-Pipelines. ## Sichere Modellverwaltung ### Safetensors **Safetensors** …
-
Python CLI Tools & Plugins
News-Wiki
· 27.04.2026
## Übersicht Spezialisierte Command-Line-Tools und Plugins für Python-Entwickler im KI-Bereich. Diese Tools verbessern den Workflow beim lokalen Arbeiten mit [LLMs](/wiki/open-source/llms/), API-Integration und Prompt-Engineering. ## Hauptwerkzeuge ### llm – Universelles CLI-Tool für LLMs Zentrales Open-Source-Tool zum …