-
Was ist Python?
Training
· 17.05.2026
## Was ist Python? - Programmiersprache, 1991 von Guido van Rossum veröffentlicht - Hat den Ruf, ungewöhnlich gut lesbar und elegant zu sein — Code im typisch…
-
RTX 3090 als P/L-Koenig: Qwen 3.6 27B im Hardware-Vergleich
Blog
· 03.05.2026
Eine gebrauchte RTX 3090 fuer ~600€ generiert Qwen 3.6 27B mit 40 Tokens pro Sekunde. Eine neue 5090 schafft 73 — kostet aber das Vierfache. Und der M5 Max liegt schlechter als die 3090. Die …
-
vLLM
Glossar
· 01.05.2026
## Definition vLLM ist ein High-Performance-Inference-Server für LLMs, der Batch-Processing und Memory-Optionen (PagedAttention, KV-Cache-Verwaltung) nutzt, um Inference-Durchsatz um ein Vielfaches zu erhöhen und Speicherverbrauch zu senken. Praktiker ersetzen damit langsame, speicherhungrige Standard-Inference durch eine produktionsreife …
-
GGUF
Glossar
· 01.05.2026
## Definition GGUF ist ein binäres Dateiformat zur Speicherung von Modellgewichten und Metadaten, das von llama.cpp entwickelt wurde und heute de-facto-Standard für das Laden großer Sprachmodelle auf Consumer-Hardware ist. Praktiker nutzen GGUF-Dateien, um Modelle wie …
-
Quantisierung
Glossar
· 01.05.2026
## Definition Quantisierung reduziert die numerische Präzision der [[Modellgewichte]] — meist von 32-Bit-Fließkommazahl (FP32) auf 8-Bit- (INT8) oder 4-Bit-Ganzzahl (INT4). Speicherverbrauch und [[Inference]]-Latenz sinken um den Faktor 4 bis 8, der Qualitätsverlust bleibt bei richtiger …
-
Unified-Memory-Workstations: 128 GB Speicher für lokale KI
Blog
· 01.05.2026
Drei Geräte teilen sich den Markt der Unified-Memory-Workstations: HP Z2 Mini G1a (Ryzen AI Max+), Asus Ascent GX10 (Nvidia DGX Spark) und Apple Mac Studio M4 Max. Alle mit 128 GByte Unified Memory ab ~3.000 …
-
Lokale Model-Setups und Hardware-Guides
News-Wiki
· 30.04.2026
## Überblick Guides und Dokumentationen zum Setup lokaler LLM-Inferenz auf eigener Hardware. Fokus auf Self-Hosted-Szenarien, Hardware-Kombinationen und praktische Konfiguration mit gängigen Frameworks. ## Frameworks und Tools - **[OpenWebUI](/wiki/tutorial/openwebui/)**: Web-Interface für lokale Modelle, oft in Kombination …
-
Claude Code: Praktische Anwendungen & Tutorials
News-Wiki
· 30.04.2026
Claude Code ist Anthropics AI-gestütztes Coding- und Automatisierungs-Tool. Diese Seite sammelt praktische Tutorials, Setups und Entscheidungshilfen für konkrete Anwendungsfälle – von lokalen Homelab-Setups bis zu Browser-Automatisierung und Knowledge-Management. ## Lokale Infrastruktur & Hardware-Setup ### DIY-Homeserver …
-
Lokale Inference & Hardware-Setup
News-Wiki
· 30.04.2026
## Überblick Lokale KI-Inferenz auf eigener Hardware wird zunehmend praktikabel und wirtschaftlich. Für Entwickler:innen bietet sich ein vielfältiges Spektrum: von Consumer-Laptops mit Apple Silicon über DIY-Homelab-Server bis zu spezialisierter Enterprise-Hardware. Die Kostenrechnung gegen Cloud-APIs wird …
-
Frontier-Modelle und Wettbewerb
News-Wiki
· 30.04.2026
## Überblick Der Frontier-Modell-Markt ist stark fragmentiert und wettbewerbsintensiv. Große Akteure wie [OpenAI](/wiki/labs/openai-modelle/), Google und Meta konkurrieren um technologische Führerschaft und Marktanteile. Zusätzlich verändern kostengünstige oder innovative Modelle aus anderen Regionen (etwa China) die Wettbewerbsdynamik …
-
Infrastruktur-Deployment (KI-Infrastruktur und Deployment)
News-Wiki
· 30.04.2026
## Übersicht Infrastruktur und Deployment sind zentrale Enabler für die praktische Nutzung von [Frontier-Modellen](/wiki/frontier-models/). Die Entscheidung zwischen lokaler Inferenz, Cloud-APIs und eigenem Datacenter-Betrieb wird durch Kosten, Verfügbarkeit und Performance-Anforderungen bestimmt. Die aktuelle Landschaft spaltet sich …
-
Agent-Modelle und Frontier-Leistung
News-Wiki
· 30.04.2026
## Überblick Agent-Modelle sind Sprachmodelle, die speziell für autonome, mehrstufige Aufgaben durch Tool-Use und Selbstüberwachung optimiert sind. Die Frontier-Entwicklung bewegt sich hin zu agentenbasierten Architekturen als Mainstream-Feature, nicht als Spezialisierung. ## Aktuelle Frontier-Modelle ### OpenAI …
-
Gemma 4: Multimodale Frontier-Modelle für Edge
News-Wiki
· 29.04.2026
## Überblick Gemma 4 ist Googles neue Modellreihe mit Multimodalität und erweiterten Reasoning-Fähigkeiten. Die Modelle kombinieren Frontier-Level-Performance mit Optimierung für lokale Bereitstellung auf ressourcenbegrenzten Geräten. Sie sind als echte Open-Source-Modelle verfügbar und ermöglichen Entwickler:innen, leistungsstarke …
-
Infrastruktur-Ökonomie & Marktstrategien
News-Wiki
· 29.04.2026
## Überblick Die Ökonomie der KI-Infrastruktur wird zunehmend zum strategischen Wettbewerbsfaktor. Während etablierte Western Labs (Google, Anthropic, Microsoft, Amazon, OpenAI) durch massive Kapitalinvestitionen Skalierungsvorteile aufbauen, verschieben neue Marktteilnehmer wie DeepSeek das Gleichgewicht durch Fokus auf …
-
Dezentralisierte & Recommender-Systeme
News-Wiki
· 29.04.2026
## Überblick Dezentralisierte Systeme verlagern Berechnung und Daten-Kontrolle von zentralen Servern zu verteilten Netzwerken. Im Kontext von Empfehlungssystemen bedeutet das: User:innen oder dritte Anbieter können eigene Recommender-Algorithmen betreiben, statt auf zentrale Plattform-Logik angewiesen zu sein. …
-
OpenClaw Updates und Entwicklungen
News-Wiki
· 29.04.2026
## Übersicht OpenClaw ist ein Framework für die Entwicklung von [LLM-Agenten](/wiki/agents/llm-agents/) und Tool-Use-Systemen. Die Plattform gewann Anfang 2026 massiv an Aufmerksamkeit, war aber anfangs mit erheblichen Sicherheitslücken konfrontiert. Das Projekt arbeitet aktiv an deren Behebung …
-
Multimodale und Vision-Modelle
News-Wiki
· 29.04.2026
## Überblick Multimodale Modelle verarbeiten mehrere Eingabetypen (Text, Bilder, Audio, Video) gleichzeitig und erzeugen Ausgaben basierend auf der kombinierten Analyse. Vision-Modelle spezialisieren sich auf Bild- und Videoanalyse. Diese Klasse ist zentral für praktische Anwendungen wie …
-
Codex Platform & Autonome Systeme
News-Wiki
· 28.04.2026
## Überblick Die Codex Platform umfasst Tools, Frameworks und Infrastruktur-Patterns zur Entwicklung autonomer Systeme – insbesondere Agent-basierte Workflows, Multi-Agent-Systeme und interaktive Trainingsumgebungen. Der Fokus liegt auf Performance-Optimierungen, dezentraler Architektur und Accessibility für Standard-Hardware. ## Agent-Workflows …
-
Autonome Agenten & Agentic AI (Open-Source)
News-Wiki
· 28.04.2026
## Überblick Autonome Agenten und Agentic AI beschreiben Systeme, die eigenständig Ziele verfolgen, Aufgaben planen und zielgerichtet handeln – typischerweise auf Basis von [Large Language Models](/wiki/llm-foundation/). Im Open-Source-Ökosystem entstehen spezialisierte Modelle, Frameworks und Werkzeuge für …
-
Medizinische Bildgebung und Biomedizinische Anwendungen
News-Wiki
· 28.04.2026
## Überblick Medizinische Bildgebung nutzt [Multimodal](/wiki/multimodal/)-KI-Verfahren zur automatisierten Analyse von Röntgen, CT, MRT, Ultraschall und anderen diagnostischen Bildern. Moderne Ansätze kombinieren Deep Learning mit Domänenwissen (Physics-Informed), um Bildqualität, Diagnosegenauigkeit und Effizienz zu verbessern. Neuerdings erweitern …
-
Audio und Multimodale Sprachverarbeitung
News-Wiki
· 28.04.2026
## Überblick Audio und Sprache sind zentrale Komponenten in multimodalen KI-Systemen. Sie ermöglichen natürliche Interaktion, Sprechererkennung und kontextbasierte Informationsverarbeitung neben Text und Bild. ## Speech-to-Text ### VibeVoice – Whisper-Alternative mit Speaker Diarization Microsoft veröffentlichte Januar …
-
KI-Chip-Supply-Chain & Hardware-Beschaffung
News-Wiki
· 28.04.2026
## Überblick Die Verfügbarkeit und Herstellung von KI-Chips (GPUs, spezialisierte Prozessoren) bildet eine kritische Infrastruktur-Bottleneck für die gesamte KI-Industrie. Engpässe bei Chip-Produktion, Fertigungstechnologie und Rohstoffen beeinflussen direkt die Skalierbarkeit von [LLM-Training](/wiki/models/llm-training/) und Inference-Systemen. ## Fertigungstechnologie …
-
Open-Source AI Frameworks & Libraries
News-Wiki
· 27.04.2026
## Übersicht Open-Source AI Frameworks sind die technologische Grundlage für KI-Entwicklung außerhalb proprietärer Plattformen. Sie decken ein breites Spektrum ab: von Sprachmodellen über Audio-Processing, Robotik-Plattformen bis zu Simulationsumgebungen und spezialisierte NLP-Libraries. ## Audio-Processing & Speech-to-Text …
-
Developer Tools & Libraries
News-Wiki
· 27.04.2026
## Claude-spezifische Tools **Claude System-Prompts als Git-Timeline** Anthropic veröffentlicht die System-Prompts für Claude-Modelle. Ein Entwickler hat diese in ein GitHub-Repository mit Fake-Commit-Daten konvertiert, um Änderungen zwischen Versionen nachverfolgbar zu machen (z.B. Opus 4.6 → 4.7). …
-
Training-Optimierung und Infrastruktur
News-Wiki
· 27.04.2026
## Überblick Training-Optimierung umfasst Techniken zur effizienten Skalierung von Modellen über lange Sequenzen, Optimierung des Inference-Durchsatzes, Parameter- und Speichereffizienz sowie kostengünstige Deployment-Strategien. Die Kernprobleme sind Speicher-Bottlenecks bei großen Kontextfenstern, Token-Management in RL-Systemen, effiziente Feinabstimmung auf …
-
Open-Source-Modelle, Robotik und Post-Training
News-Wiki
· 27.04.2026
## Überblick Open-Source-Modelle und -Frameworks ermöglichen es Entwickler:innen, KI-Systeme jenseits von reinen Sprachmodellen zu bauen: von Robotik-Anwendungen über Speech-to-Text bis zu Custom-LLM-Training. Das Ökosystem wächst mit stabilen, produktionsreifen Tools und erweitert sich kontinuierlich um On-Device-optimierte …
-
Developer-Tools und Praktiken
News-Wiki
· 27.04.2026
## Überblick Developer-Tools im KI-Kontext umfassen Code-Assistenten, APIs, lokale Modelle und Best-Practices beim Prompt Engineering. Der Markt verschiebt sich zunehmend zu agentic workflows, On-Device-Verarbeitung für bessere Latenz und Datenschutz, sowie zu Headless-Architekturen, die APIs über …
-
Robotik & Embodied AI
News-Wiki
· 27.04.2026
## Überblick Robotik und Embodied AI beschäftigen sich mit der Integration von KI-Systemen in physische Agenten. Im Open-Source-Bereich liegt der Fokus zunehmend auf praktischen Deployment-Szenarien: Vision-Language-Action-Modelle (VLA) auf Edge-Hardware, systematische Datenerfassung und Skalierung von Trainings-Infrastruktur. …
-
Multimodale Modelle für Edge & On-Device
News-Wiki
· 27.04.2026
## Übersicht Multimodale Modelle (Text + Bilder + Audio + Video) werden zunehmend für Edge-Deployment und On-Device-Szenarien optimiert. Dies ermöglicht datenschutzfreundliche KI-Anwendungen mit niedriger Latenz ohne Cloud-Abhängigkeit. Hauptanwendungsfälle: Robotik, IoT, Offline-Szenarien, Enterprise-Dokumente, Bildverarbeitung auf lokalen …
-
Qwen & DeepSeek: Frontier-Modelle mit neuer Architektur
News-Wiki
· 27.04.2026
## Überblick Qwen (Alibaba) und DeepSeek gehören zu den führenden Open-Source-Modell-Anbietern im Frontier-Segment. Beide setzen auf architektonische Innovationen – insbesondere [Mixture of Experts (MoE)](/wiki/open-source/mixture-of-experts/) – um bessere Effizienz und Skalierbarkeit zu erreichen. Die neuesten Generationen …
-
Edge-Deployment und Kompakte Multimodale Modelle
News-Wiki
· 27.04.2026
## Überblick Edge-Deployment von multimodalen KI-Modellen ermöglicht es, [Vision-Language-Modelle](/wiki/multimodal/vision-language-models/) (VLM) und Vision Language Agents (VLA) direkt auf ressourcenbegrenzten Geräten auszuführen – statt Anfragen zur Cloud zu senden. Das reduziert Latenz, verbessert Privatsphäre und ermöglicht Offline-Betrieb. …
-
Infrastruktur-Investitionen in KI
News-Wiki
· 27.04.2026
## Überblick KI-Infrastruktur ist zur kritischen Ressource geworden. Tech-Konzerne investieren Dutzende Milliarden Dollar in Rechenzentren, Custom-Hardware und Modell-Entwicklung. Dies prägt die Verfügbarkeit von Modellen, deren Trainings-Bedingungen und die langfristige Wettbewerbsfähigkeit verschiedener Plattformen. Die Skalierbarkeit hängt …
-
KI-Agenten im Enterprise: Strategien, Technologie und Marktdynamik
News-Wiki
· 27.04.2026
## Überblick KI-Agenten im Enterprise-Kontext markieren eine neue Phase der KI-Anwendung: autonome oder semi-autonome Systeme, die komplexe Aufgaben in produktiven Umgebungen ausführen. Der Markt wird von OpenAI, Anthropic, Google und Meta dominiert, die jeweils unterschiedliche …
-
Agent-Orchestrierung & Production-Ready Systeme
News-Wiki
· 27.04.2026
## Überblick Agent-Orchestrierung beschreibt die Koordination und Steuerung mehrerer KI-Agenten oder einzelner Agenten mit komplexen Task-Workflows. Sie umfasst die Verwaltung von Prompts, Tool-Integration, Workflow-Logic und Evaluierungskriterien – typischerweise für [Foundation Models](/wiki/model/foundation-models/). ## Automatische Optimierung Manuelle …
-
3D-Simulationsframeworks
News-Wiki
· 27.04.2026
## Überblick 3D-Simulationsumgebungen sind zentral für das Training von [RL-Agenten](/wiki/ml-training/reinforcement-learning/) und [Multi-Agent-Systemen](/wiki/ml-training/multi-agent-systems/). Sie ermöglichen die Evaluation von Verhalten in interaktiven Welten ohne reale Hardware. ## Frameworks ### Waypoint **Waypoint-1.5** ist ein Framework für realistische, interaktive …
-
Edge Deployment & On-Device-Optimierung
News-Wiki
· 27.04.2026
## Überblick Edge Deployment bezeichnet die Ausführung von KI-Modellen direkt auf Grenzgeräten (edge devices) – Robotern, IoT-Hardware, eingebetteten Systemen – statt auf zentralen Servern. Ziele sind Latenzreduktion, Datenschutz durch lokale Verarbeitung, Offline-Betrieb und reduzierte Netzwerkabhängigkeit. …
-
Training-Parallelismus & Skalierungstechniken
News-Wiki
· 27.04.2026
## Überblick Training-Parallelismus umfasst Techniken und Infrastruktur zur effizienten Skalierung von LLM-Training auf große Cluster. Zentrale Herausforderungen: Speicher, Durchsatz, Netzwerk-Bandbreite und Long-Context-Skalierung. ## Parallelisierungstechniken ### Ulysses Sequence Parallelism Trainingstechnik für LLMs mit sehr großen Kontextfenstern …
-
AI-System-Optimierung: Inference-Strategien
News-Wiki
· 27.04.2026
## Übersicht Inference-Optimierung ist zentral für produktive KI-Systeme: Reduzierte Latenz und geringere Compute-Kosten ermöglichen skalierbare Deployments autonomer Agenten und [LLM](/wiki/infrastructure/language-models/)-Services. Die aktuellen Forschungen (April 2026) konzentrieren sich auf intelligente Dosierung von Modellressourcen, Caching-Strategien und architektonische …
-
Google Gemma & Gemini Modelle
News-Wiki
· 27.04.2026
## Überblick Gemma ist Googles Familie von leichtgewichtigen, Open-Source-Sprachmodellen. Sie fokussieren auf praktische Deployment-Szenarien mit reduzierten Rechenressourcen – ideal für lokale, datenschutzfreundliche Anwendungen. Der Open-Source-Ansatz mit echter Lizenzfreiheit ermöglicht Entwickler:innen, Modelle anzupassen und zu verfeinern, …
-
Open-Source Frontier-Modelle
News-Wiki
· 27.04.2026
## Überblick Open-Source Frontier-Modelle sind state-of-the-art Large Language Models mit öffentlich verfügbarem Code und/oder Gewichten. Sie ermöglichen lokale Deployments, Fine-Tuning und volle Kontrolle – ohne proprietäre Beschränkungen. Der Markt entwickelt sich rasant: Modelle wie DeepSeek …
-
Konferenzen und Workshops
News-Wiki
· 27.04.2026
## Überblick Wichtige Konferenzen und Workshops zum Thema KI, mit Fokus auf Python-basierte Entwicklung und praktische Anwendungen. ## Kommende Events ### PyCon US 2026 - **Termin:** 13.–19. Mai 2026 - **Ort:** Long Beach, Kalifornien - …
-
Copilot-Modelle und Agent-getriebene Produktintegration
News-Wiki
· 27.04.2026
## Überblick Integration von KI-Modellen und Copilot-Systemen in Unternehmensumgebungen. Fokus auf Produktionsreife, Kostenmanagement, operative Constraints und praktische Einsatzszenarien jenseits von Prototyping. ## Aktuelle Plattformen und Dienste ### GitHub Copilot GitHub hat seit 2026 die Individual-Plan-Struktur …
-
Code-Agenten und Automation
News-Wiki
· 27.04.2026
## Überblick Code-Agenten automatisieren Entwicklungs-Workflows durch autonome Entscheidungsfindung und Systeminteraktion. Sie gehen über [Code-Completion](/wiki/coding-models/code-completion/) hinaus und können eigenständig IDE-Operationen, Tests, Deployments und sogar Computer-Nutzung durchführen. Der Markt zeigt rasantes Wachstum: Agent-getriebene Ressourcennutzung sprengt bisherige Pricing-Modelle …
-
Open-Source Coding-Modelle und effiziente Alternativen
News-Wiki
· 27.04.2026
## Überblick Open-Source Coding-Modelle ermöglichen es Entwickler:innen, hochleistungsfähige Code-Generierung und -Analyse lokal oder on-premise einzusetzen – ohne Cloud-Abhängigkeit. Der Trend geht klar zu effizienteren Architekturen: aktuelle Modelle erreichen Flagship-Performance bei deutlich reduzierten Parameterzahlen. Parallel wächst …
-
Benchmarks: Coding-Performance und Modelleffizienz
News-Wiki
· 27.04.2026
Benchmark-Fokus auf Coding-Performance und Effizienzmetriken – wie schnell und ressourcenschonend Sprachmodelle Programmieraufgaben lösen. ## Efficiency-Sprünge bei Coding-Modellen Die Coding-Landschaft verschiebt sich stark in Richtung Effizienz: Kleinere Modelle erzielen inzwischen die Performance grösserer Vorgänger, während Inferenzkosten …
-
Computer-Use und GUI-Automation
News-Wiki
· 27.04.2026
## Überblick Computer-Use und GUI-Automation bezeichnet die Fähigkeit von KI-Agenten, direkt mit Benutzeroberflächen zu interagieren – Screenshots zu analysieren, Maus- und Tastaturevents zu generieren und Anwendungen wie Menschen zu bedienen. Dies ermöglicht Agenten, klassische Web-Automation …
-
Robotik und Vision-Language-Agenten
News-Wiki
· 27.04.2026
## Übersicht Robotik-Agenten, die visuelle Eingaben verarbeiten und natürlichsprachige Befehle umsetzen, stellen eine zentrale Anwendungsdomäne für [Language Models](/wiki/foundation-models/language-models/) und Multi-Modal-KI dar. Der Fokus liegt auf praktischem Deployment auf ressourcenbeschränkten Systemen und vertrauenswürdigen Reasoning-Mechanismen. Die Abstraktion …
-
Open-Source und Frontier-Modelle für Agenten
News-Wiki
· 27.04.2026
## Überblick Open-Source-Frontier-Modelle erweitern die Fähigkeiten autonomer Agenten durch verbesserte Kontextverarbeitung, Tool-Use und effiziente Ressourcennutzung. Der Fokus liegt auf praktischer Skalierbarkeit – sowohl für große Cloud-Szenarien als auch für Edge-Deployments. ## Große Kontextmodelle **DeepSeek-V4** bietet …
-
Agent-Frameworks und Orchestrierung
News-Wiki
· 27.04.2026
Agent-Frameworks und Tool-Integration bilden die technische Infrastruktur für autonome KI-Agenten. Im Kern geht es um standardisierte Wege, wie Agenten externe Dienste nutzen, mit APIs kommunizieren und komplexe Multi-Step-Workflows orchestrieren. ## SDK und Runtime-Umgebungen Das **OpenAI …