Google DeepMind sichert KI-Agenten wie Mitarbeiter mit Büroschlüssel · KI-News

Google DeepMind hat eine "AI Control Roadmap" vorgelegt, die Sicherheitsmaßnahmen für KI-Agenten an messbare Leistungsmerkmale koppelt – ähnlich wie der Umgang mit potenziellen Insider-Bedrohungen. Eine Analyse von einer Million Coding-Aufgaben zeigt überraschend: Die meisten Probleme entstehen durch Übereifer der Agenten, nicht durch böswillige Absicht. Das Forschungsteam warnt vor einem engen Zeitfenster, um internationale Sicherheitsstandards für autonome KI-Systeme zu etablieren, bevor diese zu mächtig werden.

Zum Originalartikel