Microsoft trainiert KI-Modelle mit unlizenzierten Webdaten – trotz gegenteiliger Versprechen

Microsoft trainiert neue KI-Modelle mit unlizenzierten Webdaten trotz gegenteiliger Versprechen
7/10 The Decoder (DE) 05.06.2026 Frontier-Modelle Policy & Ethik Research

Microsoft hat sich bei seinen neuen MAI-Modellen von seinen früheren Versprechen zum Umgang mit Trainingsdaten abgewandt und nutzt teilweise unverschlüsselte Web-Inhalte wie Common Crawl. Das Unternehmen rechtfertigt diesen Schritt mit Fair-Use-Argumenten und externalisiert die Verantwortung für die Datenauswahl auf Webseitenbetreiber. Dies entspricht zwar dem Standard bei anderen großen Sprachmodell-Anbietern, widerlegt aber Microsofts eigenes Selbstverständnis als ethischerer Akteur im KI-Markt und zeigt, wie der wirtschaftliche Druck selbst wohlmeinende Versprechen überlagert.

Zum Originalartikel