Microsoft trainiert KI-Modelle mit unlizenzierten Webdaten – trotz gegenteiliger Versprechen · KI-News

Microsoft hat sich bei seinen neuen MAI-Modellen von seinen früheren Versprechen zum Umgang mit Trainingsdaten abgewandt und nutzt teilweise unverschlüsselte Web-Inhalte wie Common Crawl. Das Unternehmen rechtfertigt diesen Schritt mit Fair-Use-Argumenten und externalisiert die Verantwortung für die Datenauswahl auf Webseitenbetreiber. Dies entspricht zwar dem Standard bei anderen großen Sprachmodell-Anbietern, widerlegt aber Microsofts eigenes Selbstverständnis als ethischerer Akteur im KI-Markt und zeigt, wie der wirtschaftliche Druck selbst wohlmeinende Versprechen überlagert.

Zum Originalartikel