Suche: Hardware · PyGround

Verliert Europa den KI-Anschluss? Das Szenario Europe 2031

Blog · 28.07.2026

Ein Szenario über Europas Abstieg in der KI, dessen erste Vorhersage drei Jahre zu früh eintraf — und die dreieinhalb Wochen im Juni, in denen ich das an meinem eigenen Werkzeug gemerkt habe.

GPU-Server mieten oder Mini-PC kaufen: c'ts Zahlen nachgemessen

Blog · 28.07.2026

278 Euro im Monat für 20 GB Grafikspeicher, oder einmalig 1.785 Euro für 96 GB. Ich habe die beiden Modelle aus dem c't-Test des Hetzner GEX44 auf meinem eigenen Mini-PC nachgemessen — und ein drittes, …

Kimi K3: offene Gewichte, trotzdem nicht für zuhause

Blog · 21.07.2026

Kimi K3 verkürzt den Abstand chinesischer Modelle zur US-Spitze auf wenige Monate und legt seine Gewichte offen. Warum „offen“ bei 2,8 Billionen Parametern trotzdem nicht „läuft bei dir“ heißt — mit einem eigenen Blender-Experiment.

Agent ohne Cloud: warum mein Hermes trotzdem nicht lokal rechnet

Blog · 18.07.2026

c't 3003 betreibt den Hermes-Agenten komplett lokal mit Qwen 3.6 27B. Mein Pi-Agent schickt seine Prompts weiter in die Cloud — was ein Log mit 37.588 Token darüber verrät, welche Zahl bei Agenten wirklich zählt.

Beyond the AI Hype: Pip Klöckners OMR-Vortrag 2026 in 10 Minuten

Blog · 16.07.2026

148 Folien in 56 Minuten: Philipp Klöckners jährlicher KI-Lagebericht auf der OMR — Data-Center-Milliarden, die IPO-Welle Richtung Sparplan, Anthropics B2B-Dominanz und warum die Junior-Jobs-Panik statistisch wackelt.

Woher die KI kommt, wo sie steht — und was sich über ihre Zukunft sagen lässt

Blog · 15.07.2026

Christian Bauckhage erklärte 2014 seinen Studierenden, warum Go für Computer unlösbar bleibt — und schreibt seit 2016 eine Verdopplungskurve fort, die bis heute hält. Was ein zweistündiges Gespräch über Vergangenheit, Gegenwart und Prognostizierbarkeit der KI …

Open-Source-KI aus China holt auf: GLM 5.2, Kimi K2.7 und Minimax M3 im Test

Blog · 19.06.2026

Drei chinesische Open-Weights-Flaggschiffe vergleichen sich nicht mehr mit anderen freien Modellen, sondern mit der US-Spitze — zum Bruchteil des Preises. Ein YouTube-Praxistest und die Einordnung, was davon stimmt.

Beyond the AI Hype: Pip Klöckners Lagebild zur KI 2026

Blog · 16.06.2026

Anthropic überholt OpenAI, Google sitzt auf allen Jokern, China unterbietet alle — und die KI-Job-Apokalypse ist in Wahrheit ein Zinsproblem. Eine Zusammenfassung des OMR-Education-Gesprächs mit Tech-Analyst Pip Klöckner.

Hermes auf dem Raspberry Pi: Setup, Desktop-App und zwei Stolpersteine

Blog · 10.06.2026

Hermes auf dem Raspberry Pi 5: ein autonomer KI-Agent auf eigener Hardware, die neue Desktop-App — und zwei Pannen, die deterministische Leitplanken gelehrt haben.

Lokale KI-Modelle unter Windows und Linux einrichten

Blog · 10.06.2026

Ollama, LM Studio und Amuse auf eigener Hardware: was Parameterzahl und Quantisierung bedeuten, wie das AMD AI Bundle die Installation unter Windows abnimmt — und wie derselbe Stack unter Linux eingerichtet wird.

Was ist Python?

Training · 17.05.2026

## Was ist Python? - Programmiersprache, 1991 von Guido van Rossum veröffentlicht - Hat den Ruf, ungewöhnlich gut lesbar und elegant zu sein — Code im typisch…

RTX 3090 als P/L-Koenig: Qwen 3.6 27B im Hardware-Vergleich

Blog · 03.05.2026

Eine gebrauchte RTX 3090 fuer ~600€ generiert Qwen 3.6 27B mit 40 Tokens pro Sekunde. Eine neue 5090 schafft 73 — kostet aber das Vierfache. Und der M5 Max liegt schlechter als die 3090. Die …

vLLM

Glossar · 01.05.2026

## Definition vLLM ist ein High-Performance-Inference-Server für LLMs, der Batch-Processing und Memory-Optionen (PagedAttention, KV-Cache-Verwaltung) nutzt, um Inference-Durchsatz um ein Vielfaches zu erhöhen und Speicherverbrauch zu senken. Praktiker ersetzen damit langsame, speicherhungrige Standard-Inference durch eine produktionsreife …

GGUF

Glossar · 01.05.2026

## Definition GGUF ist ein binäres Dateiformat zur Speicherung von Modellgewichten und Metadaten, das von llama.cpp entwickelt wurde und heute de-facto-Standard für das Laden großer Sprachmodelle auf Consumer-Hardware ist. Praktiker nutzen GGUF-Dateien, um Modelle wie …

Quantisierung

Glossar · 01.05.2026

## Definition Quantisierung reduziert die numerische Präzision der [[Modellgewichte]] — meist von 32-Bit-Fließkommazahl (FP32) auf 8-Bit- (INT8) oder 4-Bit-Ganzzahl (INT4). Speicherverbrauch und [[Inference]]-Latenz sinken um den Faktor 4 bis 8, der Qualitätsverlust bleibt bei richtiger …

Unified-Memory-Workstations: 128 GB Speicher für lokale KI

Blog · 01.05.2026

Drei Geräte teilen sich den Markt der Unified-Memory-Workstations: HP Z2 Mini G1a (Ryzen AI Max+), Asus Ascent GX10 (Nvidia DGX Spark) und Apple Mac Studio M4 Max. Alle mit 128 GByte Unified Memory ab ~3.000 …

Lokale Model-Setups und Hardware-Guides

News-Wiki · 30.04.2026

## Überblick Guides und Dokumentationen zum Setup lokaler LLM-Inferenz auf eigener Hardware. Fokus auf Self-Hosted-Szenarien, Hardware-Kombinationen und praktische Konfiguration mit gängigen Frameworks. ## Frameworks und Tools - **[OpenWebUI](/wiki/tutorial/openwebui/)**: Web-Interface für lokale Modelle, oft in Kombination …

Claude Code: Praktische Anwendungen & Tutorials

News-Wiki · 30.04.2026

Claude Code ist Anthropics AI-gestütztes Coding- und Automatisierungs-Tool. Diese Seite sammelt praktische Tutorials, Setups und Entscheidungshilfen für konkrete Anwendungsfälle – von lokalen Homelab-Setups bis zu Browser-Automatisierung und Knowledge-Management. ## Lokale Infrastruktur & Hardware-Setup ### DIY-Homeserver …

Lokale Inference & Hardware-Setup

News-Wiki · 30.04.2026

## Überblick Lokale KI-Inferenz auf eigener Hardware wird zunehmend praktikabel und wirtschaftlich. Für Entwickler:innen bietet sich ein vielfältiges Spektrum: von Consumer-Laptops mit Apple Silicon über DIY-Homelab-Server bis zu spezialisierter Enterprise-Hardware. Die Kostenrechnung gegen Cloud-APIs wird …

Frontier-Modelle und Wettbewerb

News-Wiki · 30.04.2026

## Überblick Der Frontier-Modell-Markt ist stark fragmentiert und wettbewerbsintensiv. Große Akteure wie [OpenAI](/wiki/labs/openai-modelle/), Google und Meta konkurrieren um technologische Führerschaft und Marktanteile. Zusätzlich verändern kostengünstige oder innovative Modelle aus anderen Regionen (etwa China) die Wettbewerbsdynamik …

Infrastruktur-Deployment (KI-Infrastruktur und Deployment)

News-Wiki · 30.04.2026

## Übersicht Infrastruktur und Deployment sind zentrale Enabler für die praktische Nutzung von [Frontier-Modellen](/wiki/frontier-models/). Die Entscheidung zwischen lokaler Inferenz, Cloud-APIs und eigenem Datacenter-Betrieb wird durch Kosten, Verfügbarkeit und Performance-Anforderungen bestimmt. Die aktuelle Landschaft spaltet sich …

Agent-Modelle und Frontier-Leistung

News-Wiki · 30.04.2026

## Überblick Agent-Modelle sind Sprachmodelle, die speziell für autonome, mehrstufige Aufgaben durch Tool-Use und Selbstüberwachung optimiert sind. Die Frontier-Entwicklung bewegt sich hin zu agentenbasierten Architekturen als Mainstream-Feature, nicht als Spezialisierung. ## Aktuelle Frontier-Modelle ### OpenAI …

Gemma 4: Multimodale Frontier-Modelle für Edge

News-Wiki · 29.04.2026

## Überblick Gemma 4 ist Googles neue Modellreihe mit Multimodalität und erweiterten Reasoning-Fähigkeiten. Die Modelle kombinieren Frontier-Level-Performance mit Optimierung für lokale Bereitstellung auf ressourcenbegrenzten Geräten. Sie sind als echte Open-Source-Modelle verfügbar und ermöglichen Entwickler:innen, leistungsstarke …

Infrastruktur-Ökonomie & Marktstrategien

News-Wiki · 29.04.2026

## Überblick Die Ökonomie der KI-Infrastruktur wird zunehmend zum strategischen Wettbewerbsfaktor. Während etablierte Western Labs (Google, Anthropic, Microsoft, Amazon, OpenAI) durch massive Kapitalinvestitionen Skalierungsvorteile aufbauen, verschieben neue Marktteilnehmer wie DeepSeek das Gleichgewicht durch Fokus auf …

Dezentralisierte & Recommender-Systeme

News-Wiki · 29.04.2026

## Überblick Dezentralisierte Systeme verlagern Berechnung und Daten-Kontrolle von zentralen Servern zu verteilten Netzwerken. Im Kontext von Empfehlungssystemen bedeutet das: User:innen oder dritte Anbieter können eigene Recommender-Algorithmen betreiben, statt auf zentrale Plattform-Logik angewiesen zu sein. …

OpenClaw Updates und Entwicklungen

News-Wiki · 29.04.2026

## Übersicht OpenClaw ist ein Framework für die Entwicklung von [LLM-Agenten](/wiki/agents/llm-agents/) und Tool-Use-Systemen. Die Plattform gewann Anfang 2026 massiv an Aufmerksamkeit, war aber anfangs mit erheblichen Sicherheitslücken konfrontiert. Das Projekt arbeitet aktiv an deren Behebung …

Multimodale und Vision-Modelle

News-Wiki · 29.04.2026

## Überblick Multimodale Modelle verarbeiten mehrere Eingabetypen (Text, Bilder, Audio, Video) gleichzeitig und erzeugen Ausgaben basierend auf der kombinierten Analyse. Vision-Modelle spezialisieren sich auf Bild- und Videoanalyse. Diese Klasse ist zentral für praktische Anwendungen wie …

Codex Platform & Autonome Systeme

News-Wiki · 28.04.2026

## Überblick Die Codex Platform umfasst Tools, Frameworks und Infrastruktur-Patterns zur Entwicklung autonomer Systeme – insbesondere Agent-basierte Workflows, Multi-Agent-Systeme und interaktive Trainingsumgebungen. Der Fokus liegt auf Performance-Optimierungen, dezentraler Architektur und Accessibility für Standard-Hardware. ## Agent-Workflows …

Autonome Agenten & Agentic AI (Open-Source)

News-Wiki · 28.04.2026

## Überblick Autonome Agenten und Agentic AI beschreiben Systeme, die eigenständig Ziele verfolgen, Aufgaben planen und zielgerichtet handeln – typischerweise auf Basis von [Large Language Models](/wiki/llm-foundation/). Im Open-Source-Ökosystem entstehen spezialisierte Modelle, Frameworks und Werkzeuge für …

Medizinische Bildgebung und Biomedizinische Anwendungen

News-Wiki · 28.04.2026

## Überblick Medizinische Bildgebung nutzt [Multimodal](/wiki/multimodal/)-KI-Verfahren zur automatisierten Analyse von Röntgen, CT, MRT, Ultraschall und anderen diagnostischen Bildern. Moderne Ansätze kombinieren Deep Learning mit Domänenwissen (Physics-Informed), um Bildqualität, Diagnosegenauigkeit und Effizienz zu verbessern. Neuerdings erweitern …

Audio und Multimodale Sprachverarbeitung

News-Wiki · 28.04.2026

## Überblick Audio und Sprache sind zentrale Komponenten in multimodalen KI-Systemen. Sie ermöglichen natürliche Interaktion, Sprechererkennung und kontextbasierte Informationsverarbeitung neben Text und Bild. ## Speech-to-Text ### VibeVoice – Whisper-Alternative mit Speaker Diarization Microsoft veröffentlichte Januar …

KI-Chip-Supply-Chain & Hardware-Beschaffung

News-Wiki · 28.04.2026

## Überblick Die Verfügbarkeit und Herstellung von KI-Chips (GPUs, spezialisierte Prozessoren) bildet eine kritische Infrastruktur-Bottleneck für die gesamte KI-Industrie. Engpässe bei Chip-Produktion, Fertigungstechnologie und Rohstoffen beeinflussen direkt die Skalierbarkeit von [LLM-Training](/wiki/models/llm-training/) und Inference-Systemen. ## Fertigungstechnologie …

Open-Source AI Frameworks & Libraries

News-Wiki · 27.04.2026

## Übersicht Open-Source AI Frameworks sind die technologische Grundlage für KI-Entwicklung außerhalb proprietärer Plattformen. Sie decken ein breites Spektrum ab: von Sprachmodellen über Audio-Processing, Robotik-Plattformen bis zu Simulationsumgebungen und spezialisierte NLP-Libraries. ## Audio-Processing & Speech-to-Text …

Developer Tools & Libraries

News-Wiki · 27.04.2026

## Claude-spezifische Tools **Claude System-Prompts als Git-Timeline** Anthropic veröffentlicht die System-Prompts für Claude-Modelle. Ein Entwickler hat diese in ein GitHub-Repository mit Fake-Commit-Daten konvertiert, um Änderungen zwischen Versionen nachverfolgbar zu machen (z.B. Opus 4.6 → 4.7). …

Training-Optimierung und Infrastruktur

News-Wiki · 27.04.2026

## Überblick Training-Optimierung umfasst Techniken zur effizienten Skalierung von Modellen über lange Sequenzen, Optimierung des Inference-Durchsatzes, Parameter- und Speichereffizienz sowie kostengünstige Deployment-Strategien. Die Kernprobleme sind Speicher-Bottlenecks bei großen Kontextfenstern, Token-Management in RL-Systemen, effiziente Feinabstimmung auf …

Open-Source-Modelle, Robotik und Post-Training

News-Wiki · 27.04.2026

## Überblick Open-Source-Modelle und -Frameworks ermöglichen es Entwickler:innen, KI-Systeme jenseits von reinen Sprachmodellen zu bauen: von Robotik-Anwendungen über Speech-to-Text bis zu Custom-LLM-Training. Das Ökosystem wächst mit stabilen, produktionsreifen Tools und erweitert sich kontinuierlich um On-Device-optimierte …

Developer-Tools und Praktiken

News-Wiki · 27.04.2026

## Überblick Developer-Tools im KI-Kontext umfassen Code-Assistenten, APIs, lokale Modelle und Best-Practices beim Prompt Engineering. Der Markt verschiebt sich zunehmend zu agentic workflows, On-Device-Verarbeitung für bessere Latenz und Datenschutz, sowie zu Headless-Architekturen, die APIs über …

Robotik & Embodied AI

News-Wiki · 27.04.2026

## Überblick Robotik und Embodied AI beschäftigen sich mit der Integration von KI-Systemen in physische Agenten. Im Open-Source-Bereich liegt der Fokus zunehmend auf praktischen Deployment-Szenarien: Vision-Language-Action-Modelle (VLA) auf Edge-Hardware, systematische Datenerfassung und Skalierung von Trainings-Infrastruktur. …

Multimodale Modelle für Edge & On-Device

News-Wiki · 27.04.2026

## Übersicht Multimodale Modelle (Text + Bilder + Audio + Video) werden zunehmend für Edge-Deployment und On-Device-Szenarien optimiert. Dies ermöglicht datenschutzfreundliche KI-Anwendungen mit niedriger Latenz ohne Cloud-Abhängigkeit. Hauptanwendungsfälle: Robotik, IoT, Offline-Szenarien, Enterprise-Dokumente, Bildverarbeitung auf lokalen …

Qwen & DeepSeek: Frontier-Modelle mit neuer Architektur

News-Wiki · 27.04.2026

## Überblick Qwen (Alibaba) und DeepSeek gehören zu den führenden Open-Source-Modell-Anbietern im Frontier-Segment. Beide setzen auf architektonische Innovationen – insbesondere [Mixture of Experts (MoE)](/wiki/open-source/mixture-of-experts/) – um bessere Effizienz und Skalierbarkeit zu erreichen. Die neuesten Generationen …

Edge-Deployment und Kompakte Multimodale Modelle

News-Wiki · 27.04.2026

## Überblick Edge-Deployment von multimodalen KI-Modellen ermöglicht es, [Vision-Language-Modelle](/wiki/multimodal/vision-language-models/) (VLM) und Vision Language Agents (VLA) direkt auf ressourcenbegrenzten Geräten auszuführen – statt Anfragen zur Cloud zu senden. Das reduziert Latenz, verbessert Privatsphäre und ermöglicht Offline-Betrieb. …

Infrastruktur-Investitionen in KI

News-Wiki · 27.04.2026

## Überblick KI-Infrastruktur ist zur kritischen Ressource geworden. Tech-Konzerne investieren Dutzende Milliarden Dollar in Rechenzentren, Custom-Hardware und Modell-Entwicklung. Dies prägt die Verfügbarkeit von Modellen, deren Trainings-Bedingungen und die langfristige Wettbewerbsfähigkeit verschiedener Plattformen. Die Skalierbarkeit hängt …

KI-Agenten im Enterprise: Strategien, Technologie und Marktdynamik

News-Wiki · 27.04.2026

## Überblick KI-Agenten im Enterprise-Kontext markieren eine neue Phase der KI-Anwendung: autonome oder semi-autonome Systeme, die komplexe Aufgaben in produktiven Umgebungen ausführen. Der Markt wird von OpenAI, Anthropic, Google und Meta dominiert, die jeweils unterschiedliche …

Agent-Orchestrierung & Production-Ready Systeme

News-Wiki · 27.04.2026

## Überblick Agent-Orchestrierung beschreibt die Koordination und Steuerung mehrerer KI-Agenten oder einzelner Agenten mit komplexen Task-Workflows. Sie umfasst die Verwaltung von Prompts, Tool-Integration, Workflow-Logic und Evaluierungskriterien – typischerweise für [Foundation Models](/wiki/model/foundation-models/). ## Automatische Optimierung Manuelle …

3D-Simulationsframeworks

News-Wiki · 27.04.2026

## Überblick 3D-Simulationsumgebungen sind zentral für das Training von [RL-Agenten](/wiki/ml-training/reinforcement-learning/) und [Multi-Agent-Systemen](/wiki/ml-training/multi-agent-systems/). Sie ermöglichen die Evaluation von Verhalten in interaktiven Welten ohne reale Hardware. ## Frameworks ### Waypoint **Waypoint-1.5** ist ein Framework für realistische, interaktive …

Edge Deployment & On-Device-Optimierung

News-Wiki · 27.04.2026

## Überblick Edge Deployment bezeichnet die Ausführung von KI-Modellen direkt auf Grenzgeräten (edge devices) – Robotern, IoT-Hardware, eingebetteten Systemen – statt auf zentralen Servern. Ziele sind Latenzreduktion, Datenschutz durch lokale Verarbeitung, Offline-Betrieb und reduzierte Netzwerkabhängigkeit. …

Training-Parallelismus & Skalierungstechniken

News-Wiki · 27.04.2026

## Überblick Training-Parallelismus umfasst Techniken und Infrastruktur zur effizienten Skalierung von LLM-Training auf große Cluster. Zentrale Herausforderungen: Speicher, Durchsatz, Netzwerk-Bandbreite und Long-Context-Skalierung. ## Parallelisierungstechniken ### Ulysses Sequence Parallelism Trainingstechnik für LLMs mit sehr großen Kontextfenstern …

AI-System-Optimierung: Inference-Strategien

News-Wiki · 27.04.2026

## Übersicht Inference-Optimierung ist zentral für produktive KI-Systeme: Reduzierte Latenz und geringere Compute-Kosten ermöglichen skalierbare Deployments autonomer Agenten und [LLM](/wiki/infrastructure/language-models/)-Services. Die aktuellen Forschungen (April 2026) konzentrieren sich auf intelligente Dosierung von Modellressourcen, Caching-Strategien und architektonische …

Google Gemma & Gemini Modelle

News-Wiki · 27.04.2026

## Überblick Gemma ist Googles Familie von leichtgewichtigen, Open-Source-Sprachmodellen. Sie fokussieren auf praktische Deployment-Szenarien mit reduzierten Rechenressourcen – ideal für lokale, datenschutzfreundliche Anwendungen. Der Open-Source-Ansatz mit echter Lizenzfreiheit ermöglicht Entwickler:innen, Modelle anzupassen und zu verfeinern, …

Open-Source Frontier-Modelle

News-Wiki · 27.04.2026

## Überblick Open-Source Frontier-Modelle sind state-of-the-art Large Language Models mit öffentlich verfügbarem Code und/oder Gewichten. Sie ermöglichen lokale Deployments, Fine-Tuning und volle Kontrolle – ohne proprietäre Beschränkungen. Der Markt entwickelt sich rasant: Modelle wie DeepSeek …