Wie das ChatGPT-Wasserzeichen funktionieren wird

Wie das ChatGPT-Wasserzeichen funktionieren wird Foto

OpenAI hat vor wenigen Wochen ChatGPT eingeführt eine Methode zur automatischen Erstellung von Inhalten und weltweit überschlagen sich Nutzer und Experten (Online-Publisher, Affiliates und SEO Anbieter) vor Begeisterung, während Suchmaschinen wie Google anfangen zu zittern. Viele lieben schon jetzt das Tool, weil sie neue Wege entdecken, um es zur Erstellung von Content, Skizzen und komplexen Artikeln zu nutzen. Dagegen fürchten Autoren, dass sie vielleicht schon bald überflüssig werden. Aber keine Panik Unterschiede zwischen Texten von einer KI und einem echten Menschen lassen sich recht leicht erkennen. Dazu kündigte jüngst OpenAI an ein Wasserzeichen einzuführen, das die Erkennung von KI-generierten Texten erleichtern soll.

Wie das ChatGPT-Wasserzeichen funktioniert?

Ein Wasserzeichen ist meist eine halbtransparente Markierung (ein Logo oder Text), die in ein Bild eingebettet ist. Das Wasserzeichen zeigt an, wer der ursprüngliche Autor des Werks ist. Es ist vor allem bei Fotos und zunehmend auch bei Videos zu sehen. Beispiel aus unserer hauseigenen Bildagentur frontalvision.com:

Wie das ChatGPT-Wasserzeichen funktionieren wird Foto

Dagegen ist das Wasserzeichen in ChatGPT ein kryptografisches Verfahren, bei dem ein Muster aus Wörtern, Buchstaben und Punktierungen in Form eines Geheimcodes eingebettet wird. Die Erforschung der künstlichen Intelligenz hat auch zum Ziel, dass die KI auf die beabsichtigten Ziele ausgerichtet ist also zum Nutzen der Menschheit. Ein Sprachmodell (LLM) wie ChatGPT kann aber in einer Weise verwendet werden, die diesem Ziel zuwiderläuft. Dementsprechend soll das ChatGPT Wasserzeichen den Missbrauch von KI in einer Weise verhindern, die der Menschheit schadet. So sollen akademische Plagiate verhindert werden, aber auch massenhaft Propaganda.

ChatGPT Wasserzeichen allgemeine Funktionsweise

Das ChatGPT Wasserzeichen basiert auf einem System, das ein statistisches Muster, einen Code, in die Wahl von Wörtern und sogar Satzzeichen einbettet. Von künstlicher Intelligenz erstellte Inhalte werden mit einem ziemlich vorhersehbaren Muster der Wortwahl erzeugt. Die von Menschen und KI geschriebenen Wörter folgen einem statistischen Muster. Die Änderung des Musters der in den generierten Inhalten verwendeten Wörter ist eine Möglichkeit, den Text mit einem „Wasserzeichen“ zu versehen, damit ein System leicht erkennen kann, ob er von einem KI-Textgenerator erstellt wurde.

ChatGPT Wasserzeichen technische Funktionsweise

Technisch funktioniert das so: Laut OpenAI ist bei GPT jede Eingabe und Ausgabe eine Kette von Token, die aus Wörtern, aber auch aus Satzzeichen, Wortteilen oder mehr bestehen kann. Im Kern erzeuge GPT ständig eine Wahrscheinlichkeitsverteilung für das nächste zu erzeugende Token, die von der Kette der vorherigen Token abhängt. Nachdem das neuronale Netz die Verteilung generiert hat, wählt der OpenAI-Server ein Token entsprechend dieser Verteilung aus. Die Idee für das Wasserzeichen ist also, das nächste Token nicht zufällig auszuwählen, sondern pseudozufällig mit Hilfe einer kryptographischen Pseudozufallsfunktion, deren Schlüssel nur OpenAI bekannt ist. Das Wasserzeichen sieht für diejenigen, die den Text lesen, völlig natürlich aus, weil die Wortwahl die Zufälligkeit aller anderen Wörter nachahmt. Aber diese Zufälligkeit enthält eine Verzerrung, die nur von jemandem entdeckt werden kann, der den Schlüssel zur Entschlüsselung hat. Wenn man aber nun eine andere KI einsetzt um die Ausgabe von GPT zu paraphrasieren, könnte das Wasserzeichen anscheinend nach Angaben von OpenAI (Stand jetzt) umgangen werden.

Aber OpenAI hat für den Bereich KI-Sicherheit und -Ausrichtung eigens eine Stelle geschaffen und wird sich sicherlich auch diesem Problem annehmen. Aktuell ist noch nichts darüber bekannt, wann das ChatGPT-Wasserzeichen System zum Einsatz kommen wird.

Foto: Screenshot ChatGPT

Dieser Artikel erschien am und wurde am aktualisiert.
Nach oben scrollen