Suche: Aufmerksamkeit

KI-Woche: Interaction Models, Colossus 1 als Anthropic-Anbau, Refactoring-Benchmarks

News-Wiki · 15.05.2026

Interaction Models von Thinking Machines brechen mit der Turn-Logik. Anthropic mietet xAIs Colossus-1-Rechenzentrum komplett. Plus: METR-Benchmark stoesst bei 16 Stunden an seine Grenzen, neuer Refactoring-Benchmark misst innere Code-Qualitaet, OpenAI veroeffentlicht Security-Tools im Wochentakt.

Attention Is All You Need (paper)

Glossar · 02.05.2026

# "Attention Is All You Need" – Erklärung ## Überblick Das Paper *"Attention Is All You Need"* (Vaswani et al., 2017) führt den **Transformer** ein – eine Architektur für Sequenz-zu-Sequenz-Aufgaben (ursprünglich maschinelle Übersetzung), die komplett …

vLLM

Glossar · 01.05.2026

## Definition vLLM ist ein High-Performance-Inference-Server für LLMs, der Batch-Processing und Memory-Optionen (PagedAttention, KV-Cache-Verwaltung) nutzt, um Inference-Durchsatz um ein Vielfaches zu erhöhen und Speicherverbrauch zu senken. Praktiker ersetzen damit langsame, speicherhungrige Standard-Inference durch eine produktionsreife …

OpenClaw Updates und Entwicklungen

News-Wiki · 29.04.2026

## Übersicht OpenClaw ist ein Framework für die Entwicklung von [LLM-Agenten](/wiki/agents/llm-agents/) und Tool-Use-Systemen. Die Plattform gewann Anfang 2026 massiv an Aufmerksamkeit, war aber anfangs mit erheblichen Sicherheitslücken konfrontiert. Das Projekt arbeitet aktiv an deren Behebung …

AI-System-Optimierung: Inference-Strategien

News-Wiki · 27.04.2026

## Übersicht Inference-Optimierung ist zentral für produktive KI-Systeme: Reduzierte Latenz und geringere Compute-Kosten ermöglichen skalierbare Deployments autonomer Agenten und [LLM](/wiki/infrastructure/language-models/)-Services. Die aktuellen Forschungen (April 2026) konzentrieren sich auf intelligente Dosierung von Modellressourcen, Caching-Strategien und architektonische …

Sicherheit und Tool-Updates

News-Wiki · 27.04.2026

Übersicht zu Sicherheitsfixes, Vulnerabilities und Updates im Ökosystem von KI-Tools und Agent-Frameworks. ## OpenClaw OpenClaw ist ein Framework für Tool-Use und Agent-Workflows. Anfang 2026 wurde das Projekt durch schnelle Verbreitung und mehrere kritische Sicherheitslücken in …

Open-Source Coding-Modelle und effiziente Alternativen

News-Wiki · 27.04.2026

## Überblick Open-Source Coding-Modelle ermöglichen es Entwickler:innen, hochleistungsfähige Code-Generierung und -Analyse lokal oder on-premise einzusetzen – ohne Cloud-Abhängigkeit. Der Trend geht klar zu effizienteren Architekturen: aktuelle Modelle erreichen Flagship-Performance bei deutlich reduzierten Parameterzahlen. Parallel wächst …