-
KI-Woche: Interaction Models, Colossus 1 als Anthropic-Anbau, Refactoring-Benchmarks
News-Wiki · 15.05.2026Interaction Models von Thinking Machines brechen mit der Turn-Logik. Anthropic mietet xAIs Colossus-1-Rechenzentrum komplett. Plus: METR-Benchmark stoesst bei 16 Stunden an seine Grenzen, neuer Refactoring-Benchmark misst innere Code-Qualitaet, OpenAI veroeffentlicht Security-Tools im Wochentakt.
-
Attention Is All You Need (paper)
Glossar · 02.05.2026# "Attention Is All You Need" – Erklärung ## Überblick Das Paper *"Attention Is All You Need"* (Vaswani et al., 2017) führt den **Transformer** ein – eine Architektur für Sequenz-zu-Sequenz-Aufgaben (ursprünglich maschinelle Übersetzung), die komplett …
-
vLLM
Glossar · 01.05.2026## Definition vLLM ist ein High-Performance-Inference-Server für LLMs, der Batch-Processing und Memory-Optionen (PagedAttention, KV-Cache-Verwaltung) nutzt, um Inference-Durchsatz um ein Vielfaches zu erhöhen und Speicherverbrauch zu senken. Praktiker ersetzen damit langsame, speicherhungrige Standard-Inference durch eine produktionsreife …
-
OpenClaw Updates und Entwicklungen
News-Wiki · 29.04.2026## Übersicht OpenClaw ist ein Framework für die Entwicklung von [LLM-Agenten](/wiki/agents/llm-agents/) und Tool-Use-Systemen. Die Plattform gewann Anfang 2026 massiv an Aufmerksamkeit, war aber anfangs mit erheblichen Sicherheitslücken konfrontiert. Das Projekt arbeitet aktiv an deren Behebung …
-
AI-System-Optimierung: Inference-Strategien
News-Wiki · 27.04.2026## Übersicht Inference-Optimierung ist zentral für produktive KI-Systeme: Reduzierte Latenz und geringere Compute-Kosten ermöglichen skalierbare Deployments autonomer Agenten und [LLM](/wiki/infrastructure/language-models/)-Services. Die aktuellen Forschungen (April 2026) konzentrieren sich auf intelligente Dosierung von Modellressourcen, Caching-Strategien und architektonische …
-
Sicherheit und Tool-Updates
News-Wiki · 27.04.2026Übersicht zu Sicherheitsfixes, Vulnerabilities und Updates im Ökosystem von KI-Tools und Agent-Frameworks. ## OpenClaw OpenClaw ist ein Framework für Tool-Use und Agent-Workflows. Anfang 2026 wurde das Projekt durch schnelle Verbreitung und mehrere kritische Sicherheitslücken in …
-
Open-Source Coding-Modelle und effiziente Alternativen
News-Wiki · 27.04.2026## Überblick Open-Source Coding-Modelle ermöglichen es Entwickler:innen, hochleistungsfähige Code-Generierung und -Analyse lokal oder on-premise einzusetzen – ohne Cloud-Abhängigkeit. Der Trend geht klar zu effizienteren Architekturen: aktuelle Modelle erreichen Flagship-Performance bei deutlich reduzierten Parameterzahlen. Parallel wächst …