Suche

50 Treffer für „Architektur"
  • Python — Der Grundkurs
    Review · 15.05.2026
    Michael Kofler liefert mit der 3. Auflage seines *Python — Der Grundkurs* einen umfassenden Einstieg in die Sprache : auf 450 Seiten werden ebenso weiterführende Themen wie Wissenschafltiche Anwendungen angesprochen.
  • Vibe Coding professionell
    Review · 15.05.2026
    Addy Osmanis Buch tritt mit dem Anspruch an, das Thema Vibe Coding „professionell" auf den Punkt zu bringen: ein Leitfaden für Entwickler und Tech-Leitung, die KI ernsthaft in ihre Praxis integrieren wollen. Hält das Buch, …
  • SubQ: 12 Millionen Token Kontext – echter Durchbruch oder gut verpacktes Marketing?
    Blog · 07.05.2026
    Ein X-Post bringt ein neues Modell SubQ mit 12 Millionen Token Kontext, 150 Token/s und 300-fach niedrigeren Kosten ins Gespräch. Lohnt sich genaueres Hinschauen — oder ist das vor allem Marketing?
  • SubQ: Architektursprung oder Marketing? Eine Analyse
    Blog · 07.05.2026
    Ein Startup behauptet, mit dem Modell SubQ den Long-Context-Engpass geknackt zu haben: 12 Millionen Token Kontext, 300-fach billiger als Claude, 52-fach schneller. Eine Analyse der Technical Reports und der Community-Reaktionen — ein Hands-on-Test steht noch …
  • Claude Code: Die Anleitung für Nicht-Programmierer
    Blog · 06.05.2026
    Claude Code arbeitet direkt auf deinem Rechner: legt Dateien an, bearbeitet sie, führt Befehle aus, behebt Fehler — gesteuert per deutscher Beschreibung. Eine Schritt-für-Schritt-Anleitung ohne Programmiervorkenntnisse.
  • Vibe Coding: Wie man Saarbrücken in Three.js an einem Abend bauen kann
    Blog · 03.05.2026
    Aus der Frage „Kannst du Game-Engines programmieren?“ wurde an einem Abend ein 3D-Saarbrücken in Three.js: 40.000 Gebäude, Saarbahnen, fahrende LKW. Wie das mit Claude praktisch ablief.
  • RTX 3090 als P/L-Koenig: Qwen 3.6 27B im Hardware-Vergleich
    Blog · 03.05.2026
    Eine gebrauchte RTX 3090 fuer ~600€ generiert Qwen 3.6 27B mit 40 Tokens pro Sekunde. Eine neue 5090 schafft 73 — kostet aber das Vierfache. Und der M5 Max liegt schlechter als die 3090. Die …
  • Browser-MCP-Server
    Glossar · 02.05.2026
    ## Definition Ein **Browser-MCP-Server** ist eine Variante eines [[MCP|MCP-Servers]], die Tools bereitstellt, die nur im Browser-Kontext Sinn ergeben — Lese-/Schreib-Zugriff auf den DOM, Local-Storage, Geolocation, Clipboard etc. Der LLM-Host kann damit *die Seite veraendern*, auf …
  • Attention Is All You Need (paper)
    Glossar · 02.05.2026
    # "Attention Is All You Need" – Erklärung ## Überblick Das Paper *"Attention Is All You Need"* (Vaswani et al., 2017) führt den **Transformer** ein – eine Architektur für Sequenz-zu-Sequenz-Aufgaben (ursprünglich maschinelle Übersetzung), die komplett …
  • llama.cpp
    Glossar · 01.05.2026
    ## Definition llama.cpp ist eine C++-Laufzeitumgebung für LLMs (Large Language Models), mit der quantisierte Modelle auf CPUs und einfachen GPUs ohne PyTorch oder CUDA-Overhead ausgeführt werden. Sie ermöglicht es, 7B–70B-Parameter-Modelle (Llama, Mistral, Qwen) auf einem …
  • GGUF
    Glossar · 01.05.2026
    ## Definition GGUF ist ein binäres Dateiformat zur Speicherung von Modellgewichten und Metadaten, das von llama.cpp entwickelt wurde und heute de-facto-Standard für das Laden großer Sprachmodelle auf Consumer-Hardware ist. Praktiker nutzen GGUF-Dateien, um Modelle wie …
  • Sprachmodell
    Glossar · 01.05.2026
    ## Definition Ein Sprachmodell ist ein trainiertes neuronales Netzwerk, das die nächste Sequenz von Text-Token basierend auf vorangegangenen Tokens vorhersagt – die Grundlage für ChatGPT, Claude, Llama und andere generative KI-Systeme. Das Trade-off: je größer …
  • Unified-Memory-Workstations: 128 GB Speicher für lokale KI
    Blog · 01.05.2026
    Drei Geräte teilen sich den Markt der Unified-Memory-Workstations: HP Z2 Mini G1a (Ryzen AI Max+), Asus Ascent GX10 (Nvidia DGX Spark) und Apple Mac Studio M4 Max. Alle mit 128 GByte Unified Memory ab ~3.000 …
  • OpenClaw: Framework & Grundkonzepte
    News-Wiki · 30.04.2026
    ## Überblick OpenClaw ist ein Agent-Framework für die Entwicklung autonomer KI-Agenten. Es bietet eine strukturierte Umgebung zum Aufbau von Systemen, die eigenständig auf Basis von Zielvorgaben handeln können. ## Kernkonzepte Die grundlegenden Ideen hinter OpenClaw: …
  • Claude Code: Praktische Anwendungen & Tutorials
    News-Wiki · 30.04.2026
    Claude Code ist Anthropics AI-gestütztes Coding- und Automatisierungs-Tool. Diese Seite sammelt praktische Tutorials, Setups und Entscheidungshilfen für konkrete Anwendungsfälle – von lokalen Homelab-Setups bis zu Browser-Automatisierung und Knowledge-Management. ## Lokale Infrastruktur & Hardware-Setup ### DIY-Homeserver …
  • KI-Anwendungen und praktische Implementierung
    News-Wiki · 30.04.2026
    ## Biomedizin und Pharmazie Maschinenlernmodelle zeigen wachsendes Potenzial in der Entdeckung neuer Therapien und Wirkstoffe. Google demonstriert dies mit KI-gestützter Analyse biologischer Daten zur Identifikation neuartiger Krebstherapien – ein Anwendungsfall, der über traditionelle NLP- und …
  • Interpretierbarkeit und Transformer-Architektur
    News-Wiki · 30.04.2026
    ## Überblick Interpretierbarkeit von Transformer-Modellen beschreibt die Fähigkeit, Entscheidungen und interne Repräsentationen nachvollziehbar zu machen. Dies umfasst die Analyse von Aktivierungsmustern, die Verfolgung von Fehlerquellen und das Verständnis, wie Architektur-Entscheidungen die Lesbarkeit von Modell-Behavior beeinflussen. …
  • Risiken bei interner Frontier-Modell-Nutzung
    News-Wiki · 30.04.2026
    ## Übersicht Organisationen, die Frontier-Modelle intern nutzen – entweder zur Skalierung von Entwicklung, zur Datenverarbeitung oder als Basis für weitere Systeme – sehen sich mit mehreren Risiken konfrontiert. Diese reichen von Abhängigkeitsrisiken über Sicherheitsbedenken bis …
  • Lokale Inference & Hardware-Setup
    News-Wiki · 30.04.2026
    ## Überblick Lokale KI-Inferenz auf eigener Hardware wird zunehmend praktikabel und wirtschaftlich. Für Entwickler:innen bietet sich ein vielfältiges Spektrum: von Consumer-Laptops mit Apple Silicon über DIY-Homelab-Server bis zu spezialisierter Enterprise-Hardware. Die Kostenrechnung gegen Cloud-APIs wird …
  • Frontier-Modelle und Wettbewerb
    News-Wiki · 30.04.2026
    ## Überblick Der Frontier-Modell-Markt ist stark fragmentiert und wettbewerbsintensiv. Große Akteure wie [OpenAI](/wiki/labs/openai-modelle/), Google und Meta konkurrieren um technologische Führerschaft und Marktanteile. Zusätzlich verändern kostengünstige oder innovative Modelle aus anderen Regionen (etwa China) die Wettbewerbsdynamik …
  • Infrastruktur-Deployment (KI-Infrastruktur und Deployment)
    News-Wiki · 30.04.2026
    ## Übersicht Infrastruktur und Deployment sind zentrale Enabler für die praktische Nutzung von [Frontier-Modellen](/wiki/frontier-models/). Die Entscheidung zwischen lokaler Inferenz, Cloud-APIs und eigenem Datacenter-Betrieb wird durch Kosten, Verfügbarkeit und Performance-Anforderungen bestimmt. Die aktuelle Landschaft spaltet sich …
  • Autonome Code-Generierung und Agenten
    News-Wiki · 30.04.2026
    ## Überblick Autonome Code-Generierung beschreibt Systeme, die eigenständig Softwarecode erzeugen, validieren und integrieren – mit minimaler oder ganz ohne menschliche Eingriffe pro Zyklus. Solche Systeme kombinieren typischerweise große Sprachmodelle (LLMs), Code-Ausführungsumgebungen und Feedback-Mechanismen zu agentengestützten …
  • Spezialisierte Agent-Anwendungen
    News-Wiki · 30.04.2026
    ## Überblick Spezialisierte Agent-Anwendungen nutzen [KI-Agenten](/wiki/agents/grundlagen/) für domänenspezifische Aufgaben: Produktentwicklung, Marktforschung, wissenschaftliche Forschung, persönliches Wissensmanagement und Enterprise-Automation. Diese Anwendungen gehen über generische Chatbots hinaus und adressieren konkrete Business- oder Forschungsprobleme. ## Persönliches Wissensmanagement **KI-Second-Brain mit …
  • Agent-Modelle und Frontier-Leistung
    News-Wiki · 30.04.2026
    ## Überblick Agent-Modelle sind Sprachmodelle, die speziell für autonome, mehrstufige Aufgaben durch Tool-Use und Selbstüberwachung optimiert sind. Die Frontier-Entwicklung bewegt sich hin zu agentenbasierten Architekturen als Mainstream-Feature, nicht als Spezialisierung. ## Aktuelle Frontier-Modelle ### OpenAI …
  • Coding-Agenten in Produktion
    News-Wiki · 30.04.2026
    ## Überblick Coding-Agenten sind KI-Systeme, die autonome Softwareentwicklung durchführen: von Planung und Implementierung über Testing bis zum Deployment. Der Produktionseinsatz erfordert spezialisierte Architekturen, die zuverlässigkeit durch Validierungsschichten, Multi-Agent-Koordination und deterministische Kontrollmechanismen erhöhen statt auf einzelne …
  • Agent-Architektur und Design-Patterns
    News-Wiki · 29.04.2026
    ## Überblick Agent-Architekturen definieren, wie KI-Agenten strukturiert werden – von der Kernlogik bis zur produktiven Ausführung. Die Architektur-Entscheidungen beeinflussen Skalierbarkeit, Zuverlässigkeit und Wartbarkeit erheblich. Eine gute Agent-Architektur trennt **Kernlogik** (Reasoning, Tool-Calls, Prompting) von **Produktions-Framework** (State …
  • Production AI Infrastructure & Harness Engineering
    News-Wiki · 29.04.2026
    ## Übersicht Production AI Infrastructure beschreibt die technische Basis für zuverlässige, skalierbare und wartbare KI-Systeme in Produktionsumgebungen. Der Begriff **Harness Engineering** fasst die Verschiebung weg von klassischem [Prompt Engineering](/wiki/llm/prompt-engineering/) hin zu durchdachten Engineering-Systemen zusammen: robuste …
  • Spezialisierte Frontier-Modelle
    News-Wiki · 29.04.2026
    Spezialisierte Frontier-Modelle sind hochperformante Sprachmodelle, die auf spezifische Domänen oder Aufgaben optimiert wurden, während sie die technischen Eigenschaften von [Frontier-Modellen](/wiki/frontier-models/) beibehalten. Sie kombinieren State-of-the-Art-Reasoning mit Fachspezialiserung. ## Multimodale Spezialmodelle **NVIDIA Nemotron 3 Nano Omni** (2026) …
  • Bildgenerierung und Multimodale Bildverarbeitung
    News-Wiki · 29.04.2026
    ## Überblick Bildgenerierung ist ein zentraler Bereich der [Multimodal-KI](/wiki/multimodal/), bei dem Sprachmodelle visuellen Output aus Textbeschreibungen (Prompts) erzeugen. Moderne Modelle kombinieren Text-zu-Bild-Generierung mit fortgeschrittener Bildverarbeitung und multimodalen Fähigkeiten wie Visual Reasoning und Multilingual-Support. ## Aktuelle …
  • Infrastruktur-Ökonomie & Marktstrategien
    News-Wiki · 29.04.2026
    ## Überblick Die Ökonomie der KI-Infrastruktur wird zunehmend zum strategischen Wettbewerbsfaktor. Während etablierte Western Labs (Google, Anthropic, Microsoft, Amazon, OpenAI) durch massive Kapitalinvestitionen Skalierungsvorteile aufbauen, verschieben neue Marktteilnehmer wie DeepSeek das Gleichgewicht durch Fokus auf …
  • Data Valuation & Datenpreisgestaltung
    News-Wiki · 29.04.2026
    ## Überblick Data Valuation ist die systematische Bewertung von Trainingsdaten hinsichtlich ihres tatsächlichen Nutzwerts für Modelltraining. Im Kontext von [LLMs](/wiki/models/llms/) ist dies zentral für Fair-Use-Modelle, Data Marketplaces und optimierte [ML-Operationen](/wiki/infrastructure/ml-ops/). Die Bewertung erfolgt auf drei …
  • Dezentralisierte & Recommender-Systeme
    News-Wiki · 29.04.2026
    ## Überblick Dezentralisierte Systeme verlagern Berechnung und Daten-Kontrolle von zentralen Servern zu verteilten Netzwerken. Im Kontext von Empfehlungssystemen bedeutet das: User:innen oder dritte Anbieter können eigene Recommender-Algorithmen betreiben, statt auf zentrale Plattform-Logik angewiesen zu sein. …
  • LLM-Fähigkeiten messen
    News-Wiki · 29.04.2026
    ## Überblick Messung spezifischer LLM-Fähigkeiten ist zentral für Evaluation, Optimierung und Deployment. Standardmetriken wie Token-Genauigkeit oder Agreement mit Referenzen erfassen oft nicht die volle Komplexität realer Anforderungen. Moderne Ansätze differenzieren zwischen Token-Quality, Trainingseffektivität, Inferenz-Robustheit und …
  • Codex Platform & Autonome Systeme
    News-Wiki · 28.04.2026
    ## Überblick Die Codex Platform umfasst Tools, Frameworks und Infrastruktur-Patterns zur Entwicklung autonomer Systeme – insbesondere Agent-basierte Workflows, Multi-Agent-Systeme und interaktive Trainingsumgebungen. Der Fokus liegt auf Performance-Optimierungen, dezentraler Architektur und Accessibility für Standard-Hardware. ## Agent-Workflows …
  • Enterprise-Adoption und praktische Anwendungen
    News-Wiki · 28.04.2026
    ## Überblick Enterprise-Adoption von KI und LLMs zeigt sich in zunehmend produktiven Anwendungen. Großunternehmen setzen Frontier-Modelle und [KI-Agenten](/wiki/product/ki-agenten/) systematisch zur Automatisierung von Geschäftsprozessen ein – von Logistik bis zur Softwareentwicklung. Agent-getriebene Workflows werden zum Mainstream-Feature …
  • Spezialisierte Frontier-Modelle und Multimodal
    News-Wiki · 28.04.2026
    ## Überblick Spezialisierte Frontier-Modelle sind hochperformante Large Language Models und Multimodal-Modelle, die für spezifische Domänen oder Anwendungsbereiche optimiert wurden. Sie bauen auf Frontier-Technologie auf, sind aber nicht universell einsetzbar, sondern für konkrete Problemräume (Wissenschaft, Cybersecurity, …
  • Bias und Fairness in KI-Systemen
    News-Wiki · 28.04.2026
    ## Überblick Bias in KI-Systemen ist ein strukturelles Problem: Modelle reproduzieren Verzerrungen aus ihren Trainingsdaten und verstärken gesellschaftliche Ungleichheiten. Fairness ist nicht eindeutig definierbar und erfordert kontextabhängige Entscheidungen über akzeptable Trade-offs zwischen Genauigkeit, Repräsentation und …
  • Autonome Agenten & Agentic AI (Open-Source)
    News-Wiki · 28.04.2026
    ## Überblick Autonome Agenten und Agentic AI beschreiben Systeme, die eigenständig Ziele verfolgen, Aufgaben planen und zielgerichtet handeln – typischerweise auf Basis von [Large Language Models](/wiki/llm-foundation/). Im Open-Source-Ökosystem entstehen spezialisierte Modelle, Frameworks und Werkzeuge für …
  • Medizinische Bildgebung und Biomedizinische Anwendungen
    News-Wiki · 28.04.2026
    ## Überblick Medizinische Bildgebung nutzt [Multimodal](/wiki/multimodal/)-KI-Verfahren zur automatisierten Analyse von Röntgen, CT, MRT, Ultraschall und anderen diagnostischen Bildern. Moderne Ansätze kombinieren Deep Learning mit Domänenwissen (Physics-Informed), um Bildqualität, Diagnosegenauigkeit und Effizienz zu verbessern. Neuerdings erweitern …
  • Audio und Multimodale Sprachverarbeitung
    News-Wiki · 28.04.2026
    ## Überblick Audio und Sprache sind zentrale Komponenten in multimodalen KI-Systemen. Sie ermöglichen natürliche Interaktion, Sprechererkennung und kontextbasierte Informationsverarbeitung neben Text und Bild. ## Speech-to-Text ### VibeVoice – Whisper-Alternative mit Speaker Diarization Microsoft veröffentlichte Januar …
  • KI-Chip-Supply-Chain & Hardware-Beschaffung
    News-Wiki · 28.04.2026
    ## Überblick Die Verfügbarkeit und Herstellung von KI-Chips (GPUs, spezialisierte Prozessoren) bildet eine kritische Infrastruktur-Bottleneck für die gesamte KI-Industrie. Engpässe bei Chip-Produktion, Fertigungstechnologie und Rohstoffen beeinflussen direkt die Skalierbarkeit von [LLM-Training](/wiki/models/llm-training/) und Inference-Systemen. ## Fertigungstechnologie …
  • KI-Benchmarks, Modellvergleiche und Trends
    News-Wiki · 28.04.2026
    ## Überblick KI-Benchmarks sind zentral für die Evaluierung und den Vergleich von Language Models. Sie dienen Entwickler:innen zur Modellauswahl, Leistungsmessung und zum Tracking technologischer Fortschritte. Allerdings geraten traditionelle Benchmark-Methoden zunehmend an ihre Grenzen – insbesondere …
  • Developer Resources und Community
    News-Wiki · 28.04.2026
    ## Überblick Sammlung von Ressourcen, Communities und Tutorials für Entwickler:innen im Bereich [Agents](/wiki/agents/). Hier finden sich Guides, Newsletter, Dokumentationen und Austauschplattformen. ## Newsletter und Kurationen ### Simon Willison's Newsletter Wöchentlicher Newsletter mit Kuratierung aktueller KI-News …
  • Agent-Anwendungen in Produktion
    News-Wiki · 28.04.2026
    ## Übersicht Agent-Anwendungen in Produktion beschreiben den Einsatz autonomer [KI-Agenten](/wiki/agents/agent-grundlagen/) in realen Geschäftsprozessen und kritischen Systemen. Der Fokus liegt auf Architektur, Integration, Performance und bewährten Praktiken für skalierbare, zuverlässige Agenten-Systeme. ## Harness Engineering: Beyond Prompt …
  • Transformers.js im Browser und Extensions
    News-Wiki · 27.04.2026
    ## Übersicht Transformers.js ist eine JavaScript-Implementierung von Hugging Face, die es ermöglicht, beliebte [NLP](/wiki/fundamentals/nlp/)-Modelle direkt im Browser auszuführen – ohne serverseitige Dependencies. Dies bietet Datenschutz-Vorteile und reduziert Latenz durch lokale Inference. ## Chrome-Extensions Transformers.js lässt …
  • Embedding- und RAG-Systeme
    News-Wiki · 27.04.2026
    ## Überblick Embeddings und Reranker sind zentrale Komponenten moderner [Retrieval-Augmented-Generation (RAG)](/wiki/tutorial/rag/)-Systeme und Similarity-Search-Pipelines. Sie ermöglichen es, große Dokumentbestände effizient zu durchsuchen und die relevantesten Ergebnisse zu identifizieren. ## Embeddings Embeddings wandeln Text oder andere Daten …
  • AI Safety & Security
    News-Wiki · 27.04.2026
    Werkzeuge, Praktiken und Standards zur Sicherung von KI-Systemen gegen Missbrauch, Datenleaks und compliance-Verletzungen. ## PII-Erkennung und Redaktion **OpenAI Privacy Filter** – Open-Weight-Modell für automatische Erkennung und Maskierung von persönlich identifizierbaren Informationen (PII) in Texten. State-of-the-Art-Genauigkeit …
  • Open-Source AI Frameworks & Libraries
    News-Wiki · 27.04.2026
    ## Übersicht Open-Source AI Frameworks sind die technologische Grundlage für KI-Entwicklung außerhalb proprietärer Plattformen. Sie decken ein breites Spektrum ab: von Sprachmodellen über Audio-Processing, Robotik-Plattformen bis zu Simulationsumgebungen und spezialisierte NLP-Libraries. ## Audio-Processing & Speech-to-Text …
  • Developer Tools & Libraries
    News-Wiki · 27.04.2026
    ## Claude-spezifische Tools **Claude System-Prompts als Git-Timeline** Anthropic veröffentlicht die System-Prompts für Claude-Modelle. Ein Entwickler hat diese in ein GitHub-Repository mit Fake-Commit-Daten konvertiert, um Änderungen zwischen Versionen nachverfolgbar zu machen (z.B. Opus 4.6 → 4.7). …
  • MCP & Tool-Integration
    News-Wiki · 27.04.2026
    ## Überblick MCP (Model Context Protocol) hat sich als Standard für die Verbindung von KI-Agenten mit externen Tools, APIs und Services etabliert. Die Integration folgt dabei klare Trends: **Headless-APIs** als bevorzugte Integrationsart für native, agenten-optimierte …