-
Open-Source-KI aus China holt auf: GLM 5.2, Kimi K2.7 und Minimax M3 im Test
Blog
· 19.06.2026
Drei chinesische Open-Weights-Flaggschiffe vergleichen sich nicht mehr mit anderen freien Modellen, sondern mit der US-Spitze — zum Bruchteil des Preises. Ein YouTube-Praxistest und die Einordnung, was davon stimmt.
-
Beyond the AI Hype: Pip Klöckners Lagebild zur KI 2026
Blog
· 16.06.2026
Anthropic überholt OpenAI, Google sitzt auf allen Jokern, China unterbietet alle — und die KI-Job-Apokalypse ist in Wahrheit ein Zinsproblem. Eine Zusammenfassung des OMR-Education-Gesprächs mit Tech-Analyst Pip Klöckner.
-
So viel Code wie nie: Wie KI die Softwareentwicklung verändert
Blog
· 15.06.2026
Zwei c't-Artikel, ein Bild: GitHub-Rekorde und KI-Agenten zeigen, wie tief generative KI das Programmieren durchdrungen hat — der Bau von Desinfec't 2026 zeigt es in der Praxis. Dazu Jobmarkt, spektakuläre Pannen und eine gemeinsame Lehre: …
-
Build a Large Language Model (From Scratch)
Review
· 12.06.2026
*Build a Large Language Model (From Scratch)* zeigt, wie man ein GPT-artiges Sprachmodell komplett selbst in Python und PyTorch baut — vom Tokenizer über den Attention-Mechanismus bis zum Finetuning zum Chatbot. Alles läuft auf einem …
-
Hands-On Large Language Models
Review
· 12.06.2026
*Hands-On Large Language Models* erklärt, wie große Sprachmodelle funktionieren und wie man sie mit Python nutzt — durchgehend visuell, mit lauffähigem Code zu jedem Kapitel.
-
Hermes auf dem Raspberry Pi: Setup, Desktop-App und zwei Stolpersteine
Blog
· 10.06.2026
Hermes auf dem Raspberry Pi 5: ein autonomer KI-Agent auf eigener Hardware, die neue Desktop-App — und zwei Pannen, die deterministische Leitplanken gelehrt haben.
-
Lokale KI-Modelle unter Windows und Linux einrichten
Blog
· 10.06.2026
Ollama, LM Studio und Amuse auf eigener Hardware: was Parameterzahl und Quantisierung bedeuten, wie das AMD AI Bundle die Installation unter Windows abnimmt — und wie derselbe Stack unter Linux eingerichtet wird.
-
Vibe Coding
Glossar
· 01.06.2026
## Vibe-Coding **Definition.** Vibe-Coding bezeichnet eine konversationsbasierte Form der Softwareentwicklung, bei der die gewünschte Funktionalität in natürlicher Sprache beschrieben und der eigentliche Code von einem KI-Sprachmodell (LLM) erzeugt wird. Die entwickelnde Person steuert, testet und …
-
Coding mit KI (1. Auflage)
Review
· 15.05.2026
*Coding mit KI* (Rheinwerk 2025) von Kofler, Öggl und Springer behandelt den Einsatz von Sprachmodellen in der Softwareentwicklung — solide für den Stand Ende 2024, aus heutiger Sicht in Teilen obsolet.
-
KI-Woche: Interaction Models, Colossus 1 als Anthropic-Anbau, Refactoring-Benchmarks
News-Wiki
· 15.05.2026
Interaction Models von Thinking Machines brechen mit der Turn-Logik. Anthropic mietet xAIs Colossus-1-Rechenzentrum komplett. Plus: METR-Benchmark stoesst bei 16 Stunden an seine Grenzen, neuer Refactoring-Benchmark misst innere Code-Qualitaet, OpenAI veroeffentlicht Security-Tools im Wochentakt.
-
Vibe Coding professionell
Review
· 15.05.2026
Addy Osmanis Buch tritt mit dem Anspruch an, das Thema Vibe Coding „professionell" auf den Punkt zu bringen: ein Leitfaden für Entwickler und Tech-Leitung, die KI ernsthaft in ihre Praxis integrieren wollen. Hält das Buch, …
-
Wordle auf Deutsch: ein Build-Bericht
Blog
· 13.05.2026
Aus der Frage nach einer deutschen Wortliste wurde an einem Nachmittag ein spielbares Wordle unter /wordle/ — mit informationstheoretischem Solver, KI-Tutor-Anbindung und einem Diagnose-Twist bei der Page-Context-Bridge. Reihenfolge der Schritte und zwei Lektionen aus dem …
-
SubQ: 12 Millionen Token Kontext – echter Durchbruch oder gut verpacktes Marketing?
Blog
· 07.05.2026
Ein X-Post bringt ein neues Modell SubQ mit 12 Millionen Token Kontext, 150 Token/s und 300-fach niedrigeren Kosten ins Gespräch. Lohnt sich genaueres Hinschauen — oder ist das vor allem Marketing?
-
Browser-MCP-Server
Glossar
· 02.05.2026
## Definition Ein **Browser-MCP-Server** ist eine Variante eines [[MCP|MCP-Servers]], die Tools bereitstellt, die nur im Browser-Kontext Sinn ergeben — Lese-/Schreib-Zugriff auf den DOM, Local-Storage, Geolocation, Clipboard etc. Der LLM-Host kann damit *die Seite veraendern*, auf …
-
MCP (Model Context Protocol)
Glossar
· 02.05.2026
## Definition [[MCP]] (Model Context Protocol) ist Anthropics offener Standard fuer LLM-Tool-Kopplung. Statt jedes Werkzeug im Modell selbst zu kodieren, beschreibt ein **MCP-Server** seine Faehigkeiten als JSON-Schema; ein **MCP-Client** vermittelt zwischen LLM-Host und Server ueber …
-
Attention Is All You Need (paper)
Glossar
· 02.05.2026
# "Attention Is All You Need" – Erklärung ## Überblick Das Paper *"Attention Is All You Need"* (Vaswani et al., 2017) führt den **Transformer** ein – eine Architektur für Sequenz-zu-Sequenz-Aufgaben (ursprünglich maschinelle Übersetzung), die komplett …
-
Large Language Model
Glossar
· 01.05.2026
Ein Large Language Model (kurz LLM, englisch), teilweise übertragen großes Sprachmodell, ist die softwaretechnische Realisierung eines mathematischen Sprachmodells, das sich durch seine Fähigkeit zur Textgenerierung auszeichnet.[1][2] Es handelt sich um ein sogenanntes computerlinguistisches Wahrscheinlichkeitsmodell, das …
-
vLLM
Glossar
· 01.05.2026
## Definition vLLM ist ein High-Performance-Inference-Server für LLMs, der Batch-Processing und Memory-Optionen (PagedAttention, KV-Cache-Verwaltung) nutzt, um Inference-Durchsatz um ein Vielfaches zu erhöhen und Speicherverbrauch zu senken. Praktiker ersetzen damit langsame, speicherhungrige Standard-Inference durch eine produktionsreife …
-
llama.cpp
Glossar
· 01.05.2026
## Definition llama.cpp ist eine C++-Laufzeitumgebung für LLMs (Large Language Models), mit der quantisierte Modelle auf CPUs und einfachen GPUs ohne PyTorch oder CUDA-Overhead ausgeführt werden. Sie ermöglicht es, 7B–70B-Parameter-Modelle (Llama, Mistral, Qwen) auf einem …
-
GGUF
Glossar
· 01.05.2026
## Definition GGUF ist ein binäres Dateiformat zur Speicherung von Modellgewichten und Metadaten, das von llama.cpp entwickelt wurde und heute de-facto-Standard für das Laden großer Sprachmodelle auf Consumer-Hardware ist. Praktiker nutzen GGUF-Dateien, um Modelle wie …
-
Training
Glossar
· 01.05.2026
## Definition Training ist der Prozess, bei dem ein neuronales Netz durch iterative Anpassung seiner Gewichte auf Basis von Trainingsdaten lernt, Eingabe-Ausgabe-Muster vorherzusagen. Im modernen KI-Kontext (LLMs, Diffusion-Modelle) bedeutet dies: Millarden von Token oder Bildern …
-
Inference
Glossar
· 01.05.2026
## Definition Inference ist die Durchführung von Vorhersagen mit einem trainierten Modell auf neuen Daten — das typische "Produktions"-Szenario, bei dem ein LLM oder Diffusion-Modell praktisch arbeitet. Im Gegensatz zum Training (wo Gewichte angepasst werden) …
-
Quantisierung
Glossar
· 01.05.2026
## Definition Quantisierung reduziert die numerische Präzision der [[Modellgewichte]] — meist von 32-Bit-Fließkommazahl (FP32) auf 8-Bit- (INT8) oder 4-Bit-Ganzzahl (INT4). Speicherverbrauch und [[Inference]]-Latenz sinken um den Faktor 4 bis 8, der Qualitätsverlust bleibt bei richtiger …
-
Lokale Model-Setups und Hardware-Guides
News-Wiki
· 30.04.2026
## Überblick Guides und Dokumentationen zum Setup lokaler LLM-Inferenz auf eigener Hardware. Fokus auf Self-Hosted-Szenarien, Hardware-Kombinationen und praktische Konfiguration mit gängigen Frameworks. ## Frameworks und Tools - **[OpenWebUI](/wiki/tutorial/openwebui/)**: Web-Interface für lokale Modelle, oft in Kombination …
-
Claude Code: Praktische Anwendungen & Tutorials
News-Wiki
· 30.04.2026
Claude Code ist Anthropics AI-gestütztes Coding- und Automatisierungs-Tool. Diese Seite sammelt praktische Tutorials, Setups und Entscheidungshilfen für konkrete Anwendungsfälle – von lokalen Homelab-Setups bis zu Browser-Automatisierung und Knowledge-Management. ## Lokale Infrastruktur & Hardware-Setup ### DIY-Homeserver …
-
KI-Agenten für Spezialaufgaben
News-Wiki
· 30.04.2026
## Überblick KI-Agenten für Spezialaufgaben automatisieren domänenspezifische Arbeitsabläufe durch Multi-Agent-Systeme, Tool-Use und simulierte Schwarmintelligenz. Sie erweitern die Fähigkeiten von LLMs über reine Text-Generierung hinaus. ## Marktforschung & Produkttests **MiroFish** ist ein Open-Source-Tool für KI-gestützte Marktforschung …
-
Interpretierbarkeit und Transformer-Architektur
News-Wiki
· 30.04.2026
## Überblick Interpretierbarkeit von Transformer-Modellen beschreibt die Fähigkeit, Entscheidungen und interne Repräsentationen nachvollziehbar zu machen. Dies umfasst die Analyse von Aktivierungsmustern, die Verfolgung von Fehlerquellen und das Verständnis, wie Architektur-Entscheidungen die Lesbarkeit von Modell-Behavior beeinflussen. …
-
Lokale Inference & Hardware-Setup
News-Wiki
· 30.04.2026
## Überblick Lokale KI-Inferenz auf eigener Hardware wird zunehmend praktikabel und wirtschaftlich. Für Entwickler:innen bietet sich ein vielfältiges Spektrum: von Consumer-Laptops mit Apple Silicon über DIY-Homelab-Server bis zu spezialisierter Enterprise-Hardware. Die Kostenrechnung gegen Cloud-APIs wird …
-
AI-Coding-Agenten & Code-Generierung
News-Wiki
· 30.04.2026
## Überblick AI-Coding-Agenten sind autonome Systeme, die Softwareentwicklung teilweise oder vollständig automatisieren. Sie kombinieren Large Language Models mit Code-Ausführung, Testing und iterativer Optimierung. Die Entwicklung bewegt sich von Ad-hoc-Prompting hin zu strukturierten, produktionsreifen Frameworks. ## …
-
Anthropic Geschäftszahlen und Marktposition
News-Wiki
· 30.04.2026
## Überblick Anthropic ist ein führendes KI-Sicherheitsunternehmen, das sich auf die Entwicklung großer Sprachmodelle (insbesondere die Claude-Familie) konzentriert. Das Unternehmen hat in den letzten Jahren signifikantes Wachstum und eine starke Marktposition aufgebaut. ## Finanzielle Kennzahlen …
-
KI-Governance & Autonome Agenten-Identität
News-Wiki
· 30.04.2026
## Überblick KI-Governance-Systeme beschäftigen sich mit Steuerung, Überwachung und Identifikation von [autonomen KI-Agenten](/wiki/infrastructure/ai-agents/). Das Feld behandelt zwei zentrale Fragen: 1. **Automatisierung im Maßstab**: Wie lassen sich KI-gesteuerte Entwicklungs- und Operationsprozesse skalieren? 2. **Agent-Identität & Verifikation**: …
-
Autonome Code-Generierung und Agenten
News-Wiki
· 30.04.2026
## Überblick Autonome Code-Generierung beschreibt Systeme, die eigenständig Softwarecode erzeugen, validieren und integrieren – mit minimaler oder ganz ohne menschliche Eingriffe pro Zyklus. Solche Systeme kombinieren typischerweise große Sprachmodelle (LLMs), Code-Ausführungsumgebungen und Feedback-Mechanismen zu agentengestützten …
-
Agenten-Evaluation und reale Leistung
News-Wiki
· 30.04.2026
## Überblick Agenten-Evaluation beschäftigt sich mit der systematischen Messung und Bewertung von autonomen KI-Agenten in praktischen Szenarien. Im Gegensatz zu reinen Sprachmodell-Benchmarks müssen Agenten-Tests interaktive Fähigkeiten, Fehlerbehandlung und Entscheidungsprozesse unter Unsicherheit prüfen. Die Kluft zwischen …
-
Spezialisierte Agent-Anwendungen
News-Wiki
· 30.04.2026
## Überblick Spezialisierte Agent-Anwendungen nutzen [KI-Agenten](/wiki/agents/grundlagen/) für domänenspezifische Aufgaben: Produktentwicklung, Marktforschung, wissenschaftliche Forschung, persönliches Wissensmanagement und Enterprise-Automation. Diese Anwendungen gehen über generische Chatbots hinaus und adressieren konkrete Business- oder Forschungsprobleme. ## Persönliches Wissensmanagement **KI-Second-Brain mit …
-
Agent-Modelle und Frontier-Leistung
News-Wiki
· 30.04.2026
## Überblick Agent-Modelle sind Sprachmodelle, die speziell für autonome, mehrstufige Aufgaben durch Tool-Use und Selbstüberwachung optimiert sind. Die Frontier-Entwicklung bewegt sich hin zu agentenbasierten Architekturen als Mainstream-Feature, nicht als Spezialisierung. ## Aktuelle Frontier-Modelle ### OpenAI …
-
Coding-Agenten in Produktion
News-Wiki
· 30.04.2026
## Überblick Coding-Agenten sind KI-Systeme, die autonome Softwareentwicklung durchführen: von Planung und Implementierung über Testing bis zum Deployment. Der Produktionseinsatz erfordert spezialisierte Architekturen, die zuverlässigkeit durch Validierungsschichten, Multi-Agent-Koordination und deterministische Kontrollmechanismen erhöhen statt auf einzelne …
-
Agent-Architektur und Design-Patterns
News-Wiki
· 29.04.2026
## Überblick Agent-Architekturen definieren, wie KI-Agenten strukturiert werden – von der Kernlogik bis zur produktiven Ausführung. Die Architektur-Entscheidungen beeinflussen Skalierbarkeit, Zuverlässigkeit und Wartbarkeit erheblich. Eine gute Agent-Architektur trennt **Kernlogik** (Reasoning, Tool-Calls, Prompting) von **Produktions-Framework** (State …
-
Production AI Infrastructure & Harness Engineering
News-Wiki
· 29.04.2026
## Übersicht Production AI Infrastructure beschreibt die technische Basis für zuverlässige, skalierbare und wartbare KI-Systeme in Produktionsumgebungen. Der Begriff **Harness Engineering** fasst die Verschiebung weg von klassischem [Prompt Engineering](/wiki/llm/prompt-engineering/) hin zu durchdachten Engineering-Systemen zusammen: robuste …
-
Mehrsprachige NLP & Non-Englische Modelle
News-Wiki
· 29.04.2026
## Überblick Mehrsprachige NLP-Modelle und nicht-englische Large Language Models (LLMs) schließen eine wichtige Lücke in der KI-Landschaft. Während englischsprachige Modelle dominieren, wächst die Anzahl qualitativ hochwertiger Modelle für andere Sprachen kontinuierlich. ## Evaluation & Benchmarking …
-
Spezialisierte Frontier-Modelle
News-Wiki
· 29.04.2026
Spezialisierte Frontier-Modelle sind hochperformante Sprachmodelle, die auf spezifische Domänen oder Aufgaben optimiert wurden, während sie die technischen Eigenschaften von [Frontier-Modellen](/wiki/frontier-models/) beibehalten. Sie kombinieren State-of-the-Art-Reasoning mit Fachspezialiserung. ## Multimodale Spezialmodelle **NVIDIA Nemotron 3 Nano Omni** (2026) …
-
Enterprise-AI-Adoption und praktische Anwendungsfälle
News-Wiki
· 29.04.2026
## Überblick Enterprise-AI-Adoption beschreibt die systematische Einführung und Skalierung von KI-Systemen in Großunternehmen. Der Fokus liegt auf praktischen Anwendungsfällen, Infrastruktur und organisatorischen Herausforderungen bei der produktiven Integration von KI-Modellen in bestehende Geschäftsprozesse. Zunehmend spielen autonome …
-
Data Valuation & Datenpreisgestaltung
News-Wiki
· 29.04.2026
## Überblick Data Valuation ist die systematische Bewertung von Trainingsdaten hinsichtlich ihres tatsächlichen Nutzwerts für Modelltraining. Im Kontext von [LLMs](/wiki/models/llms/) ist dies zentral für Fair-Use-Modelle, Data Marketplaces und optimierte [ML-Operationen](/wiki/infrastructure/ml-ops/). Die Bewertung erfolgt auf drei …
-
OpenClaw Updates und Entwicklungen
News-Wiki
· 29.04.2026
## Übersicht OpenClaw ist ein Framework für die Entwicklung von [LLM-Agenten](/wiki/agents/llm-agents/) und Tool-Use-Systemen. Die Plattform gewann Anfang 2026 massiv an Aufmerksamkeit, war aber anfangs mit erheblichen Sicherheitslücken konfrontiert. Das Projekt arbeitet aktiv an deren Behebung …
-
Low-Code/No-Code und App-Generierung
News-Wiki
· 29.04.2026
## Übersicht Low-Code/No-Code-Tools automatisieren Anwendungsentwicklung durch visuelle Interfaces oder natürlichsprachige Prompts. Mit Aufkommen großer Sprachmodelle ([LLM](/wiki/foundation-models/large-language-models/)) verschiebt sich das Paradigma: KI-gesteuerte Codegenerierung wird zunehmend praktikabel für Prototyping und Boilerplate-Automation. ## Prompt-basierte Code-Generierung Moderne Ansätze nutzen …
-
Multimodale und Vision-Modelle
News-Wiki
· 29.04.2026
## Überblick Multimodale Modelle verarbeiten mehrere Eingabetypen (Text, Bilder, Audio, Video) gleichzeitig und erzeugen Ausgaben basierend auf der kombinierten Analyse. Vision-Modelle spezialisieren sich auf Bild- und Videoanalyse. Diese Klasse ist zentral für praktische Anwendungen wie …
-
LLM-Fähigkeiten messen
News-Wiki
· 29.04.2026
## Überblick Messung spezifischer LLM-Fähigkeiten ist zentral für Evaluation, Optimierung und Deployment. Standardmetriken wie Token-Genauigkeit oder Agreement mit Referenzen erfassen oft nicht die volle Komplexität realer Anforderungen. Moderne Ansätze differenzieren zwischen Token-Quality, Trainingseffektivität, Inferenz-Robustheit und …
-
Enterprise-Adoption und praktische Anwendungen
News-Wiki
· 28.04.2026
## Überblick Enterprise-Adoption von KI und LLMs zeigt sich in zunehmend produktiven Anwendungen. Großunternehmen setzen Frontier-Modelle und [KI-Agenten](/wiki/product/ki-agenten/) systematisch zur Automatisierung von Geschäftsprozessen ein – von Logistik bis zur Softwareentwicklung. Agent-getriebene Workflows werden zum Mainstream-Feature …
-
Spezialisierte Frontier-Modelle und Multimodal
News-Wiki
· 28.04.2026
## Überblick Spezialisierte Frontier-Modelle sind hochperformante Large Language Models und Multimodal-Modelle, die für spezifische Domänen oder Anwendungsbereiche optimiert wurden. Sie bauen auf Frontier-Technologie auf, sind aber nicht universell einsetzbar, sondern für konkrete Problemräume (Wissenschaft, Cybersecurity, …
-
KI-Governance und verantwortungsvoller Einsatz
News-Wiki
· 28.04.2026
## Überblick KI-Governance beschreibt Regelwerke, Richtlinien und Kontrollmechanismen, die den Einsatz von KI-Systemen lenken – insbesondere in sicherheitskritischen und hochsensiblen Bereichen. Die Branche balanciert dabei zwischen innovativen Anwendungen und Risikominderung. ## Controlled Access und spezialisierte …
-
Autonome Agenten & Agentic AI (Open-Source)
News-Wiki
· 28.04.2026
## Überblick Autonome Agenten und Agentic AI beschreiben Systeme, die eigenständig Ziele verfolgen, Aufgaben planen und zielgerichtet handeln – typischerweise auf Basis von [Large Language Models](/wiki/llm-foundation/). Im Open-Source-Ökosystem entstehen spezialisierte Modelle, Frameworks und Werkzeuge für …