OpenAI WebRTC mit Dokumentkontext: Voice-Chats im Browser über eigene Daten · KI-News

Simon Willison hat sein Web-Playground-Tool für OpenAIs WebRTC Audio API aktualisiert und nutzt dabei das neu verfügbare GPT-Realtime-2-Modell, das OpenAI als „first voice model with GPT-5-class reasoning" bewirbt. Die wichtigste Neuerung: Man kann nun Dokumente einfügen und eine Sprachkonversation darüber führen – direkt im Browser ohne App-Installation. Das zeigt praktisch, wie Realtime-Audio-Interfaces mit eigenem Kontext nutzbar werden, und verweist auf einen wachsenden Trend, KI-Modelle über Audio statt Text zu nutzen.

Zum Originalartikel