Suche: Architektur

GPU-Server mieten oder Mini-PC kaufen: c'ts Zahlen nachgemessen

Blog · 28.07.2026

278 Euro im Monat für 20 GB Grafikspeicher, oder einmalig 1.785 Euro für 96 GB. Ich habe die beiden Modelle aus dem c't-Test des Hetzner GEX44 auf meinem eigenen Mini-PC nachgemessen — und ein drittes, …

Vibe Coding oder Agentic Engineering? Googles Whitepaper zum neuen Software-Lebenszyklus

Blog · 15.07.2026

Ein Google-Whitepaper vermisst auf 51 Seiten, wie KI-Agenten die Softwareentwicklung umbauen: vom Spektrum zwischen Vibe Coding und Agentic Engineering über Context Engineering bis zur These, dass die meisten Agenten-Fehler Konfigurationsfehler sind. Zusammenfassung und Einordnung.

Woher die KI kommt, wo sie steht — und was sich über ihre Zukunft sagen lässt

Blog · 15.07.2026

Christian Bauckhage erklärte 2014 seinen Studierenden, warum Go für Computer unlösbar bleibt — und schreibt seit 2016 eine Verdopplungskurve fort, die bis heute hält. Was ein zweistündiges Gespräch über Vergangenheit, Gegenwart und Prognostizierbarkeit der KI …

Künstliche Intelligenz verstehen

Review · 18.06.2026

*Künstliche Intelligenz verstehen* erklärt klassische KI- und Machine-Learning-Verfahren von der Markov-Kette bis zum neuronalen Netz — anschaulich illustriert, mit einem lauffähigen Browser-Programm zu jedem Kapitel. Bemerkenswert: nicht in Python, sondern in JavaScript und p5.js.

Vom Hype zur Handarbeit: Ein Jahr KI-Coding im Spiegel eines Podcasts

Blog · 16.06.2026

Der Entwickler-Podcast „Index out of bounds“ hat ein Jahr lang dokumentiert, wie sich Programmieren mit KI verändert — von der Euphorie über Peter Steinbergers „Agentic Engineering“ bis zur abgeklärten Hype-Skepsis. Der Bogen in einem Stück, …

Build a Large Language Model (From Scratch)

Review · 12.06.2026

*Build a Large Language Model (From Scratch)* zeigt, wie man ein GPT-artiges Sprachmodell komplett selbst in Python und PyTorch baut — vom Tokenizer über den Attention-Mechanismus bis zum Finetuning zum Chatbot. Alles läuft auf einem …

Hands-On Large Language Models

Review · 12.06.2026

*Hands-On Large Language Models* erklärt, wie große Sprachmodelle funktionieren und wie man sie mit Python nutzt — durchgehend visuell, mit lauffähigem Code zu jedem Kapitel.

ArjanCodes hat genug vom KI-Hype

Blog · 01.06.2026

Arjan hat ein Video mit dem Titel „I'm done with the AI hype" veröffentlicht. Ich schätze ihn als Entwickler sehr – und sein Beitrag trifft mehrere Punkte, die auch in dieser Serie immer wieder auftauchen. …

Python — Der Grundkurs

Review · 15.05.2026

Michael Kofler liefert mit der 3. Auflage seines *Python — Der Grundkurs* einen umfassenden Einstieg in die Sprache : auf 450 Seiten werden ebenso weiterführende Themen wie Wissenschafltiche Anwendungen angesprochen.

Vibe Coding professionell

Review · 15.05.2026

Addy Osmanis Buch tritt mit dem Anspruch an, das Thema Vibe Coding „professionell" auf den Punkt zu bringen: ein Leitfaden für Entwickler und Tech-Leitung, die KI ernsthaft in ihre Praxis integrieren wollen. Hält das Buch, …

SubQ: 12 Millionen Token Kontext – echter Durchbruch oder gut verpacktes Marketing?

Blog · 07.05.2026

Ein X-Post bringt ein neues Modell SubQ mit 12 Millionen Token Kontext, 150 Token/s und 300-fach niedrigeren Kosten ins Gespräch. Lohnt sich genaueres Hinschauen — oder ist das vor allem Marketing?

SubQ: Architektursprung oder Marketing? Eine Analyse

Blog · 07.05.2026

Ein Startup behauptet, mit dem Modell SubQ den Long-Context-Engpass geknackt zu haben: 12 Millionen Token Kontext, 300-fach billiger als Claude, 52-fach schneller. Eine Analyse der Technical Reports und der Community-Reaktionen — ein Hands-on-Test steht noch …

Claude Code: Die Anleitung für Nicht-Programmierer

Blog · 06.05.2026

Claude Code arbeitet direkt auf deinem Rechner: legt Dateien an, bearbeitet sie, führt Befehle aus, behebt Fehler — gesteuert per deutscher Beschreibung. Eine Schritt-für-Schritt-Anleitung ohne Programmiervorkenntnisse.

Vibe Coding: Wie man Saarbrücken in Three.js an einem Abend bauen kann

Blog · 03.05.2026

Aus der Frage „Kannst du Game-Engines programmieren?“ wurde an einem Abend ein 3D-Saarbrücken in Three.js: 40.000 Gebäude, Saarbahnen, fahrende LKW. Wie das mit Claude praktisch ablief.

RTX 3090 als P/L-Koenig: Qwen 3.6 27B im Hardware-Vergleich

Blog · 03.05.2026

Eine gebrauchte RTX 3090 fuer ~600€ generiert Qwen 3.6 27B mit 40 Tokens pro Sekunde. Eine neue 5090 schafft 73 — kostet aber das Vierfache. Und der M5 Max liegt schlechter als die 3090. Die …

Browser-MCP-Server

Glossar · 02.05.2026

## Definition Ein **Browser-MCP-Server** ist eine Variante eines [[MCP|MCP-Servers]], die Tools bereitstellt, die nur im Browser-Kontext Sinn ergeben — Lese-/Schreib-Zugriff auf den DOM, Local-Storage, Geolocation, Clipboard etc. Der LLM-Host kann damit *die Seite veraendern*, auf …

Attention Is All You Need (paper)

Glossar · 02.05.2026

# "Attention Is All You Need" – Erklärung ## Überblick Das Paper *"Attention Is All You Need"* (Vaswani et al., 2017) führt den **Transformer** ein – eine Architektur für Sequenz-zu-Sequenz-Aufgaben (ursprünglich maschinelle Übersetzung), die komplett …

llama.cpp

Glossar · 01.05.2026

## Definition llama.cpp ist eine C++-Laufzeitumgebung für LLMs (Large Language Models), mit der quantisierte Modelle auf CPUs und einfachen GPUs ohne PyTorch oder CUDA-Overhead ausgeführt werden. Sie ermöglicht es, 7B–70B-Parameter-Modelle (Llama, Mistral, Qwen) auf einem …

GGUF

Glossar · 01.05.2026

## Definition GGUF ist ein binäres Dateiformat zur Speicherung von Modellgewichten und Metadaten, das von llama.cpp entwickelt wurde und heute de-facto-Standard für das Laden großer Sprachmodelle auf Consumer-Hardware ist. Praktiker nutzen GGUF-Dateien, um Modelle wie …

Sprachmodell

Glossar · 01.05.2026

## Definition Ein Sprachmodell ist ein trainiertes neuronales Netzwerk, das die nächste Sequenz von Text-Token basierend auf vorangegangenen Tokens vorhersagt – die Grundlage für ChatGPT, Claude, Llama und andere generative KI-Systeme. Das Trade-off: je größer …

Unified-Memory-Workstations: 128 GB Speicher für lokale KI

Blog · 01.05.2026

Drei Geräte teilen sich den Markt der Unified-Memory-Workstations: HP Z2 Mini G1a (Ryzen AI Max+), Asus Ascent GX10 (Nvidia DGX Spark) und Apple Mac Studio M4 Max. Alle mit 128 GByte Unified Memory ab ~3.000 …

OpenClaw: Framework & Grundkonzepte

News-Wiki · 30.04.2026

## Überblick OpenClaw ist ein Agent-Framework für die Entwicklung autonomer KI-Agenten. Es bietet eine strukturierte Umgebung zum Aufbau von Systemen, die eigenständig auf Basis von Zielvorgaben handeln können. ## Kernkonzepte Die grundlegenden Ideen hinter OpenClaw: …

Claude Code: Praktische Anwendungen & Tutorials

News-Wiki · 30.04.2026

Claude Code ist Anthropics AI-gestütztes Coding- und Automatisierungs-Tool. Diese Seite sammelt praktische Tutorials, Setups und Entscheidungshilfen für konkrete Anwendungsfälle – von lokalen Homelab-Setups bis zu Browser-Automatisierung und Knowledge-Management. ## Lokale Infrastruktur & Hardware-Setup ### DIY-Homeserver …

KI-Anwendungen und praktische Implementierung

News-Wiki · 30.04.2026

## Biomedizin und Pharmazie Maschinenlernmodelle zeigen wachsendes Potenzial in der Entdeckung neuer Therapien und Wirkstoffe. Google demonstriert dies mit KI-gestützter Analyse biologischer Daten zur Identifikation neuartiger Krebstherapien – ein Anwendungsfall, der über traditionelle NLP- und …

Interpretierbarkeit und Transformer-Architektur

News-Wiki · 30.04.2026

## Überblick Interpretierbarkeit von Transformer-Modellen beschreibt die Fähigkeit, Entscheidungen und interne Repräsentationen nachvollziehbar zu machen. Dies umfasst die Analyse von Aktivierungsmustern, die Verfolgung von Fehlerquellen und das Verständnis, wie Architektur-Entscheidungen die Lesbarkeit von Modell-Behavior beeinflussen. …

Risiken bei interner Frontier-Modell-Nutzung

News-Wiki · 30.04.2026

## Übersicht Organisationen, die Frontier-Modelle intern nutzen – entweder zur Skalierung von Entwicklung, zur Datenverarbeitung oder als Basis für weitere Systeme – sehen sich mit mehreren Risiken konfrontiert. Diese reichen von Abhängigkeitsrisiken über Sicherheitsbedenken bis …

Lokale Inference & Hardware-Setup

News-Wiki · 30.04.2026

## Überblick Lokale KI-Inferenz auf eigener Hardware wird zunehmend praktikabel und wirtschaftlich. Für Entwickler:innen bietet sich ein vielfältiges Spektrum: von Consumer-Laptops mit Apple Silicon über DIY-Homelab-Server bis zu spezialisierter Enterprise-Hardware. Die Kostenrechnung gegen Cloud-APIs wird …

Frontier-Modelle und Wettbewerb

News-Wiki · 30.04.2026

## Überblick Der Frontier-Modell-Markt ist stark fragmentiert und wettbewerbsintensiv. Große Akteure wie [OpenAI](/wiki/labs/openai-modelle/), Google und Meta konkurrieren um technologische Führerschaft und Marktanteile. Zusätzlich verändern kostengünstige oder innovative Modelle aus anderen Regionen (etwa China) die Wettbewerbsdynamik …

Infrastruktur-Deployment (KI-Infrastruktur und Deployment)

News-Wiki · 30.04.2026

## Übersicht Infrastruktur und Deployment sind zentrale Enabler für die praktische Nutzung von [Frontier-Modellen](/wiki/frontier-models/). Die Entscheidung zwischen lokaler Inferenz, Cloud-APIs und eigenem Datacenter-Betrieb wird durch Kosten, Verfügbarkeit und Performance-Anforderungen bestimmt. Die aktuelle Landschaft spaltet sich …

Autonome Code-Generierung und Agenten

News-Wiki · 30.04.2026

## Überblick Autonome Code-Generierung beschreibt Systeme, die eigenständig Softwarecode erzeugen, validieren und integrieren – mit minimaler oder ganz ohne menschliche Eingriffe pro Zyklus. Solche Systeme kombinieren typischerweise große Sprachmodelle (LLMs), Code-Ausführungsumgebungen und Feedback-Mechanismen zu agentengestützten …

Spezialisierte Agent-Anwendungen

News-Wiki · 30.04.2026

## Überblick Spezialisierte Agent-Anwendungen nutzen [KI-Agenten](/wiki/agents/grundlagen/) für domänenspezifische Aufgaben: Produktentwicklung, Marktforschung, wissenschaftliche Forschung, persönliches Wissensmanagement und Enterprise-Automation. Diese Anwendungen gehen über generische Chatbots hinaus und adressieren konkrete Business- oder Forschungsprobleme. ## Persönliches Wissensmanagement **KI-Second-Brain mit …

Agent-Modelle und Frontier-Leistung

News-Wiki · 30.04.2026

## Überblick Agent-Modelle sind Sprachmodelle, die speziell für autonome, mehrstufige Aufgaben durch Tool-Use und Selbstüberwachung optimiert sind. Die Frontier-Entwicklung bewegt sich hin zu agentenbasierten Architekturen als Mainstream-Feature, nicht als Spezialisierung. ## Aktuelle Frontier-Modelle ### OpenAI …

Coding-Agenten in Produktion

News-Wiki · 30.04.2026

## Überblick Coding-Agenten sind KI-Systeme, die autonome Softwareentwicklung durchführen: von Planung und Implementierung über Testing bis zum Deployment. Der Produktionseinsatz erfordert spezialisierte Architekturen, die zuverlässigkeit durch Validierungsschichten, Multi-Agent-Koordination und deterministische Kontrollmechanismen erhöhen statt auf einzelne …

Agent-Architektur und Design-Patterns

News-Wiki · 29.04.2026

## Überblick Agent-Architekturen definieren, wie KI-Agenten strukturiert werden – von der Kernlogik bis zur produktiven Ausführung. Die Architektur-Entscheidungen beeinflussen Skalierbarkeit, Zuverlässigkeit und Wartbarkeit erheblich. Eine gute Agent-Architektur trennt **Kernlogik** (Reasoning, Tool-Calls, Prompting) von **Produktions-Framework** (State …

Production AI Infrastructure & Harness Engineering

News-Wiki · 29.04.2026

## Übersicht Production AI Infrastructure beschreibt die technische Basis für zuverlässige, skalierbare und wartbare KI-Systeme in Produktionsumgebungen. Der Begriff **Harness Engineering** fasst die Verschiebung weg von klassischem [Prompt Engineering](/wiki/llm/prompt-engineering/) hin zu durchdachten Engineering-Systemen zusammen: robuste …

Spezialisierte Frontier-Modelle

News-Wiki · 29.04.2026

Spezialisierte Frontier-Modelle sind hochperformante Sprachmodelle, die auf spezifische Domänen oder Aufgaben optimiert wurden, während sie die technischen Eigenschaften von [Frontier-Modellen](/wiki/frontier-models/) beibehalten. Sie kombinieren State-of-the-Art-Reasoning mit Fachspezialiserung. ## Multimodale Spezialmodelle **NVIDIA Nemotron 3 Nano Omni** (2026) …

Bildgenerierung und Multimodale Bildverarbeitung

News-Wiki · 29.04.2026

## Überblick Bildgenerierung ist ein zentraler Bereich der [Multimodal-KI](/wiki/multimodal/), bei dem Sprachmodelle visuellen Output aus Textbeschreibungen (Prompts) erzeugen. Moderne Modelle kombinieren Text-zu-Bild-Generierung mit fortgeschrittener Bildverarbeitung und multimodalen Fähigkeiten wie Visual Reasoning und Multilingual-Support. ## Aktuelle …

Infrastruktur-Ökonomie & Marktstrategien

News-Wiki · 29.04.2026

## Überblick Die Ökonomie der KI-Infrastruktur wird zunehmend zum strategischen Wettbewerbsfaktor. Während etablierte Western Labs (Google, Anthropic, Microsoft, Amazon, OpenAI) durch massive Kapitalinvestitionen Skalierungsvorteile aufbauen, verschieben neue Marktteilnehmer wie DeepSeek das Gleichgewicht durch Fokus auf …

Data Valuation & Datenpreisgestaltung

News-Wiki · 29.04.2026

## Überblick Data Valuation ist die systematische Bewertung von Trainingsdaten hinsichtlich ihres tatsächlichen Nutzwerts für Modelltraining. Im Kontext von [LLMs](/wiki/models/llms/) ist dies zentral für Fair-Use-Modelle, Data Marketplaces und optimierte [ML-Operationen](/wiki/infrastructure/ml-ops/). Die Bewertung erfolgt auf drei …

Dezentralisierte & Recommender-Systeme

News-Wiki · 29.04.2026

## Überblick Dezentralisierte Systeme verlagern Berechnung und Daten-Kontrolle von zentralen Servern zu verteilten Netzwerken. Im Kontext von Empfehlungssystemen bedeutet das: User:innen oder dritte Anbieter können eigene Recommender-Algorithmen betreiben, statt auf zentrale Plattform-Logik angewiesen zu sein. …

LLM-Fähigkeiten messen

News-Wiki · 29.04.2026

## Überblick Messung spezifischer LLM-Fähigkeiten ist zentral für Evaluation, Optimierung und Deployment. Standardmetriken wie Token-Genauigkeit oder Agreement mit Referenzen erfassen oft nicht die volle Komplexität realer Anforderungen. Moderne Ansätze differenzieren zwischen Token-Quality, Trainingseffektivität, Inferenz-Robustheit und …

Codex Platform & Autonome Systeme

News-Wiki · 28.04.2026

## Überblick Die Codex Platform umfasst Tools, Frameworks und Infrastruktur-Patterns zur Entwicklung autonomer Systeme – insbesondere Agent-basierte Workflows, Multi-Agent-Systeme und interaktive Trainingsumgebungen. Der Fokus liegt auf Performance-Optimierungen, dezentraler Architektur und Accessibility für Standard-Hardware. ## Agent-Workflows …

Enterprise-Adoption und praktische Anwendungen

News-Wiki · 28.04.2026

## Überblick Enterprise-Adoption von KI und LLMs zeigt sich in zunehmend produktiven Anwendungen. Großunternehmen setzen Frontier-Modelle und [KI-Agenten](/wiki/product/ki-agenten/) systematisch zur Automatisierung von Geschäftsprozessen ein – von Logistik bis zur Softwareentwicklung. Agent-getriebene Workflows werden zum Mainstream-Feature …

Spezialisierte Frontier-Modelle und Multimodal

News-Wiki · 28.04.2026

## Überblick Spezialisierte Frontier-Modelle sind hochperformante Large Language Models und Multimodal-Modelle, die für spezifische Domänen oder Anwendungsbereiche optimiert wurden. Sie bauen auf Frontier-Technologie auf, sind aber nicht universell einsetzbar, sondern für konkrete Problemräume (Wissenschaft, Cybersecurity, …

Bias und Fairness in KI-Systemen

News-Wiki · 28.04.2026

## Überblick Bias in KI-Systemen ist ein strukturelles Problem: Modelle reproduzieren Verzerrungen aus ihren Trainingsdaten und verstärken gesellschaftliche Ungleichheiten. Fairness ist nicht eindeutig definierbar und erfordert kontextabhängige Entscheidungen über akzeptable Trade-offs zwischen Genauigkeit, Repräsentation und …

Autonome Agenten & Agentic AI (Open-Source)

News-Wiki · 28.04.2026

## Überblick Autonome Agenten und Agentic AI beschreiben Systeme, die eigenständig Ziele verfolgen, Aufgaben planen und zielgerichtet handeln – typischerweise auf Basis von [Large Language Models](/wiki/llm-foundation/). Im Open-Source-Ökosystem entstehen spezialisierte Modelle, Frameworks und Werkzeuge für …

Medizinische Bildgebung und Biomedizinische Anwendungen

News-Wiki · 28.04.2026

## Überblick Medizinische Bildgebung nutzt [Multimodal](/wiki/multimodal/)-KI-Verfahren zur automatisierten Analyse von Röntgen, CT, MRT, Ultraschall und anderen diagnostischen Bildern. Moderne Ansätze kombinieren Deep Learning mit Domänenwissen (Physics-Informed), um Bildqualität, Diagnosegenauigkeit und Effizienz zu verbessern. Neuerdings erweitern …

Audio und Multimodale Sprachverarbeitung

News-Wiki · 28.04.2026

## Überblick Audio und Sprache sind zentrale Komponenten in multimodalen KI-Systemen. Sie ermöglichen natürliche Interaktion, Sprechererkennung und kontextbasierte Informationsverarbeitung neben Text und Bild. ## Speech-to-Text ### VibeVoice – Whisper-Alternative mit Speaker Diarization Microsoft veröffentlichte Januar …

KI-Chip-Supply-Chain & Hardware-Beschaffung

News-Wiki · 28.04.2026

## Überblick Die Verfügbarkeit und Herstellung von KI-Chips (GPUs, spezialisierte Prozessoren) bildet eine kritische Infrastruktur-Bottleneck für die gesamte KI-Industrie. Engpässe bei Chip-Produktion, Fertigungstechnologie und Rohstoffen beeinflussen direkt die Skalierbarkeit von [LLM-Training](/wiki/models/llm-training/) und Inference-Systemen. ## Fertigungstechnologie …

KI-Benchmarks, Modellvergleiche und Trends

News-Wiki · 28.04.2026

## Überblick KI-Benchmarks sind zentral für die Evaluierung und den Vergleich von Language Models. Sie dienen Entwickler:innen zur Modellauswahl, Leistungsmessung und zum Tracking technologischer Fortschritte. Allerdings geraten traditionelle Benchmark-Methoden zunehmend an ihre Grenzen – insbesondere …