Bias und Fairness in KI-Systemen

28.04.2026 07:27

Überblick

Bias in KI-Systemen ist ein strukturelles Problem: Modelle reproduzieren Verzerrungen aus ihren Trainingsdaten und verstärken gesellschaftliche Ungleichheiten. Fairness ist nicht eindeutig definierbar und erfordert kontextabhängige Entscheidungen über akzeptable Trade-offs zwischen Genauigkeit, Repräsentation und Zugang.

Demografische Biases in Generative Models

Text-to-Image-Modelle wie Stable Diffusion zeigen systematische demografische Verzerrungen: Berufsbezeichnungen wie "Doctor" oder "CEO" werden überproportional mit hellhäutigen Personen assoziiert, während Positionen mit niedrigerem Status größere demografische Vielfalt aufweisen. Dieser Bias ist direkt aus den Trainingsdaten emergent.

Target-based Prompting

Ein leichtgewichtiger Ansatz zur Bias-Reduktion arbeitet auf Inference-Time-Ebene durch gezielte Prompt-Interventionen, ohne das Modell selbst zu modifizieren. Das Framework verzichtet auf eine single Definition von Fairness und ist damit für die meisten Nutzer:innen zugänglich.

Vorteile: - Kein Retraining erforderlich - Keine kurierten Datasets nötig - Nutzer:innen können Fairness-Ziele flexibel nach eigenem Kontext definieren - Skalierbar auf Inference-Time - Demografische Repräsentation kann für spezifische Berufsfelder gezielt gesteuert werden

Zentrale Herausforderungen

  • Fairness ist multidimensional: Verschiedene Stakeholder haben unterschiedliche Anforderungen (Accuracy, Representational Fairness, Procedural Fairness).
  • Trade-offs: Bias-Reduktion kann zu Performance-Verlust oder zu stärkerer Steuerung durch Prompts führen.
  • Skalierbarkeit: Inference-Time-Techniken sind skalierbar, strukturelle Lösungen (Daten-Kurierung, Modell-Architektur) sind aufwendiger.
  • Messung: Bias ist schwer zu quantifizieren, da die "Wahrheit" kontextabhängig ist.
  • Generalisierbarkeit: Prompt-basierte Lösungen sind zugänglich, erfordern aber für jede Anwendung bewusste Intervention.

Praktische Ansätze

  • Prompt Engineering: Explizite Diversitätsvorgaben in Prompts; insbesondere gezielte Prompt-Interventionen zur Bias-Reduktion ohne Modell-Retraining.
  • Post-Processing: Filterung oder Neugewichtung von Outputs.
  • Training-Phase: Curated Datasets, fairness-aware Loss-Funktionen, Adversarial Debiasing.
  • Monitoring: Regelmäßige Fairness-Audits über demografische Untergruppen.

Einzelnachweise

Stichworte

Policy & Ethik