Suche

21 Treffer für „Research"
  • SubQ: 12 Millionen Token Kontext – echter Durchbruch oder gut verpacktes Marketing?
    Blog · 07.05.2026
    Ein X-Post bringt ein neues Modell SubQ mit 12 Millionen Token Kontext, 150 Token/s und 300-fach niedrigeren Kosten ins Gespräch. Lohnt sich genaueres Hinschauen — oder ist das vor allem Marketing?
  • SubQ: Architektursprung oder Marketing? Eine Analyse
    Blog · 07.05.2026
    Ein Startup behauptet, mit dem Modell SubQ den Long-Context-Engpass geknackt zu haben: 12 Millionen Token Kontext, 300-fach billiger als Claude, 52-fach schneller. Eine Analyse der Technical Reports und der Community-Reaktionen — ein Hands-on-Test steht noch …
  • Interpretierbarkeit und Transformer-Architektur
    News-Wiki · 30.04.2026
    ## Überblick Interpretierbarkeit von Transformer-Modellen beschreibt die Fähigkeit, Entscheidungen und interne Repräsentationen nachvollziehbar zu machen. Dies umfasst die Analyse von Aktivierungsmustern, die Verfolgung von Fehlerquellen und das Verständnis, wie Architektur-Entscheidungen die Lesbarkeit von Modell-Behavior beeinflussen. …
  • KI-Governance & Autonome Agenten-Identität
    News-Wiki · 30.04.2026
    ## Überblick KI-Governance-Systeme beschäftigen sich mit Steuerung, Überwachung und Identifikation von [autonomen KI-Agenten](/wiki/infrastructure/ai-agents/). Das Feld behandelt zwei zentrale Fragen: 1. **Automatisierung im Maßstab**: Wie lassen sich KI-gesteuerte Entwicklungs- und Operationsprozesse skalieren? 2. **Agent-Identität & Verifikation**: …
  • KI-Narrative und Trends
    News-Wiki · 28.04.2026
    ## Überblick Die KI-Landschaft wird von widersprechenden Narrativen geprägt: Einerseits werden existenzielle Risiken und Jobverluste diskutiert, andererseits behaupten führende KI-Labore bereits zu wissen, wie AGI skaliert wird. Diese Page fasst aktuelle Narrative, Trends und deren …
  • Autonome Agenten & Agentic AI (Open-Source)
    News-Wiki · 28.04.2026
    ## Überblick Autonome Agenten und Agentic AI beschreiben Systeme, die eigenständig Ziele verfolgen, Aufgaben planen und zielgerichtet handeln – typischerweise auf Basis von [Large Language Models](/wiki/llm-foundation/). Im Open-Source-Ökosystem entstehen spezialisierte Modelle, Frameworks und Werkzeuge für …
  • Developer Resources und Community
    News-Wiki · 28.04.2026
    ## Überblick Sammlung von Ressourcen, Communities und Tutorials für Entwickler:innen im Bereich [Agents](/wiki/agents/). Hier finden sich Guides, Newsletter, Dokumentationen und Austauschplattformen. ## Newsletter und Kurationen ### Simon Willison's Newsletter Wöchentlicher Newsletter mit Kuratierung aktueller KI-News …
  • Warum Lisp? Wie man Computern das Ableiten beibringt
    Blog · 27.04.2026
    Eine kommentierte Aufarbeitung des Vortrags von Edmund Weitz (HAW Hamburg). Symbolisches Differenzieren in 30 Zeilen Lisp - und was Homoikonizität und Makros so besonders machen. Inklusive Lisp-Interpreter zum direkt Ausprobieren im Pyground-Playground.
  • Codex: Agent-Framework & Automatisierung
    News-Wiki · 27.04.2026
    ## Überblick Codex ist ein Agent-Framework von OpenAI für die Entwicklung autonomer Agenten, die Aufgaben automatisiert ausführen können. Es kombiniert Code-Generierung mit strukturierten Workflows und Tool-Integration. Typische Anwendungen sind automatisierte Datenverarbeitung, Report-Generierung und Integration in …
  • Agent Frameworks & Orchestrierung
    News-Wiki · 27.04.2026
    ## Überblick Agent Frameworks sind Plattformen und Libraries zur Entwicklung, Orchestrierung und Deployment von autonomen Agenten. Sie abstrahieren die Komplexität von Multi-Step-Reasoning, Tool-Integration und Workflow-Management und ermöglichen es Entwickler:innen, handlungsfähige KI-Systeme zu bauen, die über …
  • Vision-Language-Modelle und Modell-Architekturen
    News-Wiki · 27.04.2026
    ## Claude ### Capabilities und Architektur Die Claude-Familie wird in offiziellen Dokumentationen detailliert beschrieben. Zentrale technische Aspekte: - **Offensive Capabilities**: Erweiterte Funktionen für Code-Generierung, Reasoning und kontextabhängiges Problemlösen - **Selbstverbesserungsmechanismen**: Iterative Output-Validierung und Optimierung durch …
  • Sicherheit und Alignment von LLMs
    News-Wiki · 27.04.2026
    ## Überblick Sicherheit und Alignment beschreiben die Herausforderung, KI-Systeme – insbesondere große Sprachmodelle – so zu gestalten und zu trainieren, dass sie zuverlässig den Absichten ihrer Betreiber entsprechen und nicht zu Manipulation, Täuschung oder unkontrolliertem …
  • Agent-Systeme: Autonome Agenten und Multi-Agent-Systeme
    News-Wiki · 27.04.2026
    ## Überblick Agent-Systeme sind KI-basierte Systeme, die autonom Entscheidungen treffen, Tools nutzen und längerfristige Aufgaben in komplexen Umgebungen verfolgen. Der Fokus liegt auf Reasoning, Tool-Integration, Memory und Koordination in Multi-Agent-Settings. Aktuelle Forschung zeigt, dass spezialisierte …
  • Modell-Benchmarking und Leistungsvergleiche
    News-Wiki · 27.04.2026
    ## Übersicht Modell-Benchmarking ist zentral für die Evaluierung von Large Language Models (LLMs) – doch die Aussagekraft von Standardbenchmarks wird zunehmend infrage gestellt. Mit schneller iterierenden Modellveröffentlichungen offenbaren sich erhebliche Lücken zwischen Benchmark-Performance und praktischen …
  • Agent-Orchestrierung & Production-Ready Systeme
    News-Wiki · 27.04.2026
    ## Überblick Agent-Orchestrierung beschreibt die Koordination und Steuerung mehrerer KI-Agenten oder einzelner Agenten mit komplexen Task-Workflows. Sie umfasst die Verwaltung von Prompts, Tool-Integration, Workflow-Logic und Evaluierungskriterien – typischerweise für [Foundation Models](/wiki/model/foundation-models/). ## Automatische Optimierung Manuelle …
  • Code-Agenten und Automation
    News-Wiki · 27.04.2026
    ## Überblick Code-Agenten automatisieren Entwicklungs-Workflows durch autonome Entscheidungsfindung und Systeminteraktion. Sie gehen über [Code-Completion](/wiki/coding-models/code-completion/) hinaus und können eigenständig IDE-Operationen, Tests, Deployments und sogar Computer-Nutzung durchführen. Der Markt zeigt rasantes Wachstum: Agent-getriebene Ressourcennutzung sprengt bisherige Pricing-Modelle …
  • Benchmark-Kritik und Aussagekraft
    News-Wiki · 27.04.2026
    ## Überblick Benchmarks sind zentral für die Evaluierung von KI-Modellen, aber ihre Aussagekraft und Zuverlässigkeit werden zunehmend kritisch hinterfragt. Dieser Artikel dokumentiert bekannte Limitationen, methodische Probleme und aktuelle Debatten zum Benchmarking in der KI-Praxis. ## …
  • Domain-spezifische und spezialisierte Benchmarks
    News-Wiki · 27.04.2026
    ## Überblick Domain-spezifische Benchmarks evaluieren KI-Modelle unter Bedingungen, die realen Anwendungsszenarien entsprechen. Sie unterscheiden sich von allgemeinen Benchmarks durch: - Verwendung von Daten und Metriken aus konkreten Fachbereichen - Integration von Fachexpertise in die Evaluierungsmethodik …
  • Evaluierungs-Frameworks
    News-Wiki · 27.04.2026
    ## Übersicht Evaluierungs-Frameworks und Benchmarks sind zentral für die Bewertung von KI-Systemen. Sie bieten standardisierte Metriken, ermöglichen Vergleichbarkeit und helfen, Stärken und Schwächen von Modellen und [Agenten](/wiki/benchmarks/agents/) objektiv zu erfassen. ## Frameworks für spezielle Anwendungsdomänen …
  • Agent-Evaluation und Optimierung
    News-Wiki · 27.04.2026
    ## Überblick Evaluation und Optimierung von [Agenten](/wiki/agents/agents/) sind zentral für deren Einsatz in Produktion. Agenten müssen zuverlässig arbeiten, Kosten minimieren und Performance-Anforderungen erfüllen. Dabei geht es um systematische Qualitätsprüfung, Messung von Verhaltensmustern und kontinuierliche Verbesserung …
  • Agent-Frameworks und Orchestrierung
    News-Wiki · 27.04.2026
    Agent-Frameworks und Tool-Integration bilden die technische Infrastruktur für autonome KI-Agenten. Im Kern geht es um standardisierte Wege, wie Agenten externe Dienste nutzen, mit APIs kommunizieren und komplexe Multi-Step-Workflows orchestrieren. ## SDK und Runtime-Umgebungen Das **OpenAI …