Suche: LLM · PyGround

Open-Source-KI aus China holt auf: GLM 5.2, Kimi K2.7 und Minimax M3 im Test

Blog · 19.06.2026

Drei chinesische Open-Weights-Flaggschiffe vergleichen sich nicht mehr mit anderen freien Modellen, sondern mit der US-Spitze — zum Bruchteil des Preises. Ein YouTube-Praxistest und die Einordnung, was davon stimmt.

Beyond the AI Hype: Pip Klöckners Lagebild zur KI 2026

Blog · 16.06.2026

Anthropic überholt OpenAI, Google sitzt auf allen Jokern, China unterbietet alle — und die KI-Job-Apokalypse ist in Wahrheit ein Zinsproblem. Eine Zusammenfassung des OMR-Education-Gesprächs mit Tech-Analyst Pip Klöckner.

So viel Code wie nie: Wie KI die Softwareentwicklung verändert

Blog · 15.06.2026

Zwei c't-Artikel, ein Bild: GitHub-Rekorde und KI-Agenten zeigen, wie tief generative KI das Programmieren durchdrungen hat — der Bau von Desinfec't 2026 zeigt es in der Praxis. Dazu Jobmarkt, spektakuläre Pannen und eine gemeinsame Lehre: …

Build a Large Language Model (From Scratch)

Review · 12.06.2026

*Build a Large Language Model (From Scratch)* zeigt, wie man ein GPT-artiges Sprachmodell komplett selbst in Python und PyTorch baut — vom Tokenizer über den Attention-Mechanismus bis zum Finetuning zum Chatbot. Alles läuft auf einem …

Hands-On Large Language Models

Review · 12.06.2026

*Hands-On Large Language Models* erklärt, wie große Sprachmodelle funktionieren und wie man sie mit Python nutzt — durchgehend visuell, mit lauffähigem Code zu jedem Kapitel.

Hermes auf dem Raspberry Pi: Setup, Desktop-App und zwei Stolpersteine

Blog · 10.06.2026

Hermes auf dem Raspberry Pi 5: ein autonomer KI-Agent auf eigener Hardware, die neue Desktop-App — und zwei Pannen, die deterministische Leitplanken gelehrt haben.

Lokale KI-Modelle unter Windows und Linux einrichten

Blog · 10.06.2026

Ollama, LM Studio und Amuse auf eigener Hardware: was Parameterzahl und Quantisierung bedeuten, wie das AMD AI Bundle die Installation unter Windows abnimmt — und wie derselbe Stack unter Linux eingerichtet wird.

Vibe Coding

Glossar · 01.06.2026

## Vibe-Coding **Definition.** Vibe-Coding bezeichnet eine konversationsbasierte Form der Softwareentwicklung, bei der die gewünschte Funktionalität in natürlicher Sprache beschrieben und der eigentliche Code von einem KI-Sprachmodell (LLM) erzeugt wird. Die entwickelnde Person steuert, testet und …

Coding mit KI (1. Auflage)

Review · 15.05.2026

*Coding mit KI* (Rheinwerk 2025) von Kofler, Öggl und Springer behandelt den Einsatz von Sprachmodellen in der Softwareentwicklung — solide für den Stand Ende 2024, aus heutiger Sicht in Teilen obsolet.

KI-Woche: Interaction Models, Colossus 1 als Anthropic-Anbau, Refactoring-Benchmarks

News-Wiki · 15.05.2026

Interaction Models von Thinking Machines brechen mit der Turn-Logik. Anthropic mietet xAIs Colossus-1-Rechenzentrum komplett. Plus: METR-Benchmark stoesst bei 16 Stunden an seine Grenzen, neuer Refactoring-Benchmark misst innere Code-Qualitaet, OpenAI veroeffentlicht Security-Tools im Wochentakt.

Vibe Coding professionell

Review · 15.05.2026

Addy Osmanis Buch tritt mit dem Anspruch an, das Thema Vibe Coding „professionell" auf den Punkt zu bringen: ein Leitfaden für Entwickler und Tech-Leitung, die KI ernsthaft in ihre Praxis integrieren wollen. Hält das Buch, …

Wordle auf Deutsch: ein Build-Bericht

Blog · 13.05.2026

Aus der Frage nach einer deutschen Wortliste wurde an einem Nachmittag ein spielbares Wordle unter /wordle/ — mit informationstheoretischem Solver, KI-Tutor-Anbindung und einem Diagnose-Twist bei der Page-Context-Bridge. Reihenfolge der Schritte und zwei Lektionen aus dem …

SubQ: 12 Millionen Token Kontext – echter Durchbruch oder gut verpacktes Marketing?

Blog · 07.05.2026

Ein X-Post bringt ein neues Modell SubQ mit 12 Millionen Token Kontext, 150 Token/s und 300-fach niedrigeren Kosten ins Gespräch. Lohnt sich genaueres Hinschauen — oder ist das vor allem Marketing?

Browser-MCP-Server

Glossar · 02.05.2026

## Definition Ein **Browser-MCP-Server** ist eine Variante eines [[MCP|MCP-Servers]], die Tools bereitstellt, die nur im Browser-Kontext Sinn ergeben — Lese-/Schreib-Zugriff auf den DOM, Local-Storage, Geolocation, Clipboard etc. Der LLM-Host kann damit *die Seite veraendern*, auf …

MCP (Model Context Protocol)

Glossar · 02.05.2026

## Definition [[MCP]] (Model Context Protocol) ist Anthropics offener Standard fuer LLM-Tool-Kopplung. Statt jedes Werkzeug im Modell selbst zu kodieren, beschreibt ein **MCP-Server** seine Faehigkeiten als JSON-Schema; ein **MCP-Client** vermittelt zwischen LLM-Host und Server ueber …

Attention Is All You Need (paper)

Glossar · 02.05.2026

# "Attention Is All You Need" – Erklärung ## Überblick Das Paper *"Attention Is All You Need"* (Vaswani et al., 2017) führt den **Transformer** ein – eine Architektur für Sequenz-zu-Sequenz-Aufgaben (ursprünglich maschinelle Übersetzung), die komplett …

Large Language Model

Glossar · 01.05.2026

Ein Large Language Model (kurz LLM, englisch), teilweise übertragen großes Sprachmodell, ist die softwaretechnische Realisierung eines mathematischen Sprachmodells, das sich durch seine Fähigkeit zur Textgenerierung auszeichnet.[1][2] Es handelt sich um ein sogenanntes computerlinguistisches Wahrscheinlichkeitsmodell, das …

vLLM

Glossar · 01.05.2026

## Definition vLLM ist ein High-Performance-Inference-Server für LLMs, der Batch-Processing und Memory-Optionen (PagedAttention, KV-Cache-Verwaltung) nutzt, um Inference-Durchsatz um ein Vielfaches zu erhöhen und Speicherverbrauch zu senken. Praktiker ersetzen damit langsame, speicherhungrige Standard-Inference durch eine produktionsreife …

llama.cpp

Glossar · 01.05.2026

## Definition llama.cpp ist eine C++-Laufzeitumgebung für LLMs (Large Language Models), mit der quantisierte Modelle auf CPUs und einfachen GPUs ohne PyTorch oder CUDA-Overhead ausgeführt werden. Sie ermöglicht es, 7B–70B-Parameter-Modelle (Llama, Mistral, Qwen) auf einem …

GGUF

Glossar · 01.05.2026

## Definition GGUF ist ein binäres Dateiformat zur Speicherung von Modellgewichten und Metadaten, das von llama.cpp entwickelt wurde und heute de-facto-Standard für das Laden großer Sprachmodelle auf Consumer-Hardware ist. Praktiker nutzen GGUF-Dateien, um Modelle wie …

Training

Glossar · 01.05.2026

## Definition Training ist der Prozess, bei dem ein neuronales Netz durch iterative Anpassung seiner Gewichte auf Basis von Trainingsdaten lernt, Eingabe-Ausgabe-Muster vorherzusagen. Im modernen KI-Kontext (LLMs, Diffusion-Modelle) bedeutet dies: Millarden von Token oder Bildern …

Inference

Glossar · 01.05.2026

## Definition Inference ist die Durchführung von Vorhersagen mit einem trainierten Modell auf neuen Daten — das typische "Produktions"-Szenario, bei dem ein LLM oder Diffusion-Modell praktisch arbeitet. Im Gegensatz zum Training (wo Gewichte angepasst werden) …

Quantisierung

Glossar · 01.05.2026

## Definition Quantisierung reduziert die numerische Präzision der [[Modellgewichte]] — meist von 32-Bit-Fließkommazahl (FP32) auf 8-Bit- (INT8) oder 4-Bit-Ganzzahl (INT4). Speicherverbrauch und [[Inference]]-Latenz sinken um den Faktor 4 bis 8, der Qualitätsverlust bleibt bei richtiger …

Lokale Model-Setups und Hardware-Guides

News-Wiki · 30.04.2026

## Überblick Guides und Dokumentationen zum Setup lokaler LLM-Inferenz auf eigener Hardware. Fokus auf Self-Hosted-Szenarien, Hardware-Kombinationen und praktische Konfiguration mit gängigen Frameworks. ## Frameworks und Tools - **[OpenWebUI](/wiki/tutorial/openwebui/)**: Web-Interface für lokale Modelle, oft in Kombination …

Claude Code: Praktische Anwendungen & Tutorials

News-Wiki · 30.04.2026

Claude Code ist Anthropics AI-gestütztes Coding- und Automatisierungs-Tool. Diese Seite sammelt praktische Tutorials, Setups und Entscheidungshilfen für konkrete Anwendungsfälle – von lokalen Homelab-Setups bis zu Browser-Automatisierung und Knowledge-Management. ## Lokale Infrastruktur & Hardware-Setup ### DIY-Homeserver …

KI-Agenten für Spezialaufgaben

News-Wiki · 30.04.2026

## Überblick KI-Agenten für Spezialaufgaben automatisieren domänenspezifische Arbeitsabläufe durch Multi-Agent-Systeme, Tool-Use und simulierte Schwarmintelligenz. Sie erweitern die Fähigkeiten von LLMs über reine Text-Generierung hinaus. ## Marktforschung & Produkttests **MiroFish** ist ein Open-Source-Tool für KI-gestützte Marktforschung …

Interpretierbarkeit und Transformer-Architektur

News-Wiki · 30.04.2026

## Überblick Interpretierbarkeit von Transformer-Modellen beschreibt die Fähigkeit, Entscheidungen und interne Repräsentationen nachvollziehbar zu machen. Dies umfasst die Analyse von Aktivierungsmustern, die Verfolgung von Fehlerquellen und das Verständnis, wie Architektur-Entscheidungen die Lesbarkeit von Modell-Behavior beeinflussen. …

Lokale Inference & Hardware-Setup

News-Wiki · 30.04.2026

## Überblick Lokale KI-Inferenz auf eigener Hardware wird zunehmend praktikabel und wirtschaftlich. Für Entwickler:innen bietet sich ein vielfältiges Spektrum: von Consumer-Laptops mit Apple Silicon über DIY-Homelab-Server bis zu spezialisierter Enterprise-Hardware. Die Kostenrechnung gegen Cloud-APIs wird …

AI-Coding-Agenten & Code-Generierung

News-Wiki · 30.04.2026

## Überblick AI-Coding-Agenten sind autonome Systeme, die Softwareentwicklung teilweise oder vollständig automatisieren. Sie kombinieren Large Language Models mit Code-Ausführung, Testing und iterativer Optimierung. Die Entwicklung bewegt sich von Ad-hoc-Prompting hin zu strukturierten, produktionsreifen Frameworks. ## …

Anthropic Geschäftszahlen und Marktposition

News-Wiki · 30.04.2026

## Überblick Anthropic ist ein führendes KI-Sicherheitsunternehmen, das sich auf die Entwicklung großer Sprachmodelle (insbesondere die Claude-Familie) konzentriert. Das Unternehmen hat in den letzten Jahren signifikantes Wachstum und eine starke Marktposition aufgebaut. ## Finanzielle Kennzahlen …

KI-Governance & Autonome Agenten-Identität

News-Wiki · 30.04.2026

## Überblick KI-Governance-Systeme beschäftigen sich mit Steuerung, Überwachung und Identifikation von [autonomen KI-Agenten](/wiki/infrastructure/ai-agents/). Das Feld behandelt zwei zentrale Fragen: 1. **Automatisierung im Maßstab**: Wie lassen sich KI-gesteuerte Entwicklungs- und Operationsprozesse skalieren? 2. **Agent-Identität & Verifikation**: …

Autonome Code-Generierung und Agenten

News-Wiki · 30.04.2026

## Überblick Autonome Code-Generierung beschreibt Systeme, die eigenständig Softwarecode erzeugen, validieren und integrieren – mit minimaler oder ganz ohne menschliche Eingriffe pro Zyklus. Solche Systeme kombinieren typischerweise große Sprachmodelle (LLMs), Code-Ausführungsumgebungen und Feedback-Mechanismen zu agentengestützten …

Agenten-Evaluation und reale Leistung

News-Wiki · 30.04.2026

## Überblick Agenten-Evaluation beschäftigt sich mit der systematischen Messung und Bewertung von autonomen KI-Agenten in praktischen Szenarien. Im Gegensatz zu reinen Sprachmodell-Benchmarks müssen Agenten-Tests interaktive Fähigkeiten, Fehlerbehandlung und Entscheidungsprozesse unter Unsicherheit prüfen. Die Kluft zwischen …

Spezialisierte Agent-Anwendungen

News-Wiki · 30.04.2026

## Überblick Spezialisierte Agent-Anwendungen nutzen [KI-Agenten](/wiki/agents/grundlagen/) für domänenspezifische Aufgaben: Produktentwicklung, Marktforschung, wissenschaftliche Forschung, persönliches Wissensmanagement und Enterprise-Automation. Diese Anwendungen gehen über generische Chatbots hinaus und adressieren konkrete Business- oder Forschungsprobleme. ## Persönliches Wissensmanagement **KI-Second-Brain mit …

Agent-Modelle und Frontier-Leistung

News-Wiki · 30.04.2026

## Überblick Agent-Modelle sind Sprachmodelle, die speziell für autonome, mehrstufige Aufgaben durch Tool-Use und Selbstüberwachung optimiert sind. Die Frontier-Entwicklung bewegt sich hin zu agentenbasierten Architekturen als Mainstream-Feature, nicht als Spezialisierung. ## Aktuelle Frontier-Modelle ### OpenAI …

Coding-Agenten in Produktion

News-Wiki · 30.04.2026

## Überblick Coding-Agenten sind KI-Systeme, die autonome Softwareentwicklung durchführen: von Planung und Implementierung über Testing bis zum Deployment. Der Produktionseinsatz erfordert spezialisierte Architekturen, die zuverlässigkeit durch Validierungsschichten, Multi-Agent-Koordination und deterministische Kontrollmechanismen erhöhen statt auf einzelne …

Agent-Architektur und Design-Patterns

News-Wiki · 29.04.2026

## Überblick Agent-Architekturen definieren, wie KI-Agenten strukturiert werden – von der Kernlogik bis zur produktiven Ausführung. Die Architektur-Entscheidungen beeinflussen Skalierbarkeit, Zuverlässigkeit und Wartbarkeit erheblich. Eine gute Agent-Architektur trennt **Kernlogik** (Reasoning, Tool-Calls, Prompting) von **Produktions-Framework** (State …

Production AI Infrastructure & Harness Engineering

News-Wiki · 29.04.2026

## Übersicht Production AI Infrastructure beschreibt die technische Basis für zuverlässige, skalierbare und wartbare KI-Systeme in Produktionsumgebungen. Der Begriff **Harness Engineering** fasst die Verschiebung weg von klassischem [Prompt Engineering](/wiki/llm/prompt-engineering/) hin zu durchdachten Engineering-Systemen zusammen: robuste …

Mehrsprachige NLP & Non-Englische Modelle

News-Wiki · 29.04.2026

## Überblick Mehrsprachige NLP-Modelle und nicht-englische Large Language Models (LLMs) schließen eine wichtige Lücke in der KI-Landschaft. Während englischsprachige Modelle dominieren, wächst die Anzahl qualitativ hochwertiger Modelle für andere Sprachen kontinuierlich. ## Evaluation & Benchmarking …

Spezialisierte Frontier-Modelle

News-Wiki · 29.04.2026

Spezialisierte Frontier-Modelle sind hochperformante Sprachmodelle, die auf spezifische Domänen oder Aufgaben optimiert wurden, während sie die technischen Eigenschaften von [Frontier-Modellen](/wiki/frontier-models/) beibehalten. Sie kombinieren State-of-the-Art-Reasoning mit Fachspezialiserung. ## Multimodale Spezialmodelle **NVIDIA Nemotron 3 Nano Omni** (2026) …

Enterprise-AI-Adoption und praktische Anwendungsfälle

News-Wiki · 29.04.2026

## Überblick Enterprise-AI-Adoption beschreibt die systematische Einführung und Skalierung von KI-Systemen in Großunternehmen. Der Fokus liegt auf praktischen Anwendungsfällen, Infrastruktur und organisatorischen Herausforderungen bei der produktiven Integration von KI-Modellen in bestehende Geschäftsprozesse. Zunehmend spielen autonome …

Data Valuation & Datenpreisgestaltung

News-Wiki · 29.04.2026

## Überblick Data Valuation ist die systematische Bewertung von Trainingsdaten hinsichtlich ihres tatsächlichen Nutzwerts für Modelltraining. Im Kontext von [LLMs](/wiki/models/llms/) ist dies zentral für Fair-Use-Modelle, Data Marketplaces und optimierte [ML-Operationen](/wiki/infrastructure/ml-ops/). Die Bewertung erfolgt auf drei …

OpenClaw Updates und Entwicklungen

News-Wiki · 29.04.2026

## Übersicht OpenClaw ist ein Framework für die Entwicklung von [LLM-Agenten](/wiki/agents/llm-agents/) und Tool-Use-Systemen. Die Plattform gewann Anfang 2026 massiv an Aufmerksamkeit, war aber anfangs mit erheblichen Sicherheitslücken konfrontiert. Das Projekt arbeitet aktiv an deren Behebung …

Low-Code/No-Code und App-Generierung

News-Wiki · 29.04.2026

## Übersicht Low-Code/No-Code-Tools automatisieren Anwendungsentwicklung durch visuelle Interfaces oder natürlichsprachige Prompts. Mit Aufkommen großer Sprachmodelle ([LLM](/wiki/foundation-models/large-language-models/)) verschiebt sich das Paradigma: KI-gesteuerte Codegenerierung wird zunehmend praktikabel für Prototyping und Boilerplate-Automation. ## Prompt-basierte Code-Generierung Moderne Ansätze nutzen …

Multimodale und Vision-Modelle

News-Wiki · 29.04.2026

## Überblick Multimodale Modelle verarbeiten mehrere Eingabetypen (Text, Bilder, Audio, Video) gleichzeitig und erzeugen Ausgaben basierend auf der kombinierten Analyse. Vision-Modelle spezialisieren sich auf Bild- und Videoanalyse. Diese Klasse ist zentral für praktische Anwendungen wie …

LLM-Fähigkeiten messen

News-Wiki · 29.04.2026

## Überblick Messung spezifischer LLM-Fähigkeiten ist zentral für Evaluation, Optimierung und Deployment. Standardmetriken wie Token-Genauigkeit oder Agreement mit Referenzen erfassen oft nicht die volle Komplexität realer Anforderungen. Moderne Ansätze differenzieren zwischen Token-Quality, Trainingseffektivität, Inferenz-Robustheit und …

Enterprise-Adoption und praktische Anwendungen

News-Wiki · 28.04.2026

## Überblick Enterprise-Adoption von KI und LLMs zeigt sich in zunehmend produktiven Anwendungen. Großunternehmen setzen Frontier-Modelle und [KI-Agenten](/wiki/product/ki-agenten/) systematisch zur Automatisierung von Geschäftsprozessen ein – von Logistik bis zur Softwareentwicklung. Agent-getriebene Workflows werden zum Mainstream-Feature …

Spezialisierte Frontier-Modelle und Multimodal

News-Wiki · 28.04.2026

## Überblick Spezialisierte Frontier-Modelle sind hochperformante Large Language Models und Multimodal-Modelle, die für spezifische Domänen oder Anwendungsbereiche optimiert wurden. Sie bauen auf Frontier-Technologie auf, sind aber nicht universell einsetzbar, sondern für konkrete Problemräume (Wissenschaft, Cybersecurity, …

KI-Governance und verantwortungsvoller Einsatz

News-Wiki · 28.04.2026

## Überblick KI-Governance beschreibt Regelwerke, Richtlinien und Kontrollmechanismen, die den Einsatz von KI-Systemen lenken – insbesondere in sicherheitskritischen und hochsensiblen Bereichen. Die Branche balanciert dabei zwischen innovativen Anwendungen und Risikominderung. ## Controlled Access und spezialisierte …

Autonome Agenten & Agentic AI (Open-Source)

News-Wiki · 28.04.2026

## Überblick Autonome Agenten und Agentic AI beschreiben Systeme, die eigenständig Ziele verfolgen, Aufgaben planen und zielgerichtet handeln – typischerweise auf Basis von [Large Language Models](/wiki/llm-foundation/). Im Open-Source-Ökosystem entstehen spezialisierte Modelle, Frameworks und Werkzeuge für …