Insight

Entspricht ChatGPT den Anforderungen der DSGVO? – Untersuchung des Rechts auf Vergessenwerden

30.01.2023

Locations

Die Popularität von ChatGPT und anderen generativen KI-Modellen hat in den letzten Jahren zugenommen, und viele Unternehmen nutzen sie zur Generierung neuer Inhalte. Diese Nutzung wirft jedoch eine Reihe ethischer und rechtlicher Bedenken auf, vor allem in Bezug auf den Datenschutz. Eine dieser Fragen ist, ob OpenAI Artikel 17 der Datenschutz-Grundverordnung (DSGVO) einhalten und die Daten einer Person vollständig aus dem Modell löschen kann, wenn diese darum bittet.

Das Recht auf Vergessenwerden
Nach der DSGVO haben Personen bei Vorliegen der in Artikel 17 DSGVO näher definierter Voraussetzungen das Recht, zu verlangen, dass ihre personenbezogenen Daten vom Verantwortlichen gelöscht werden. Dies wird als "Recht auf Vergessenwerden" oder "Recht auf Löschung" bezeichnet und gibt dem Einzelnen mehr Kontrolle über seine personenbezogenen Daten.

Insbesondere enn jemand mit der Verarbeitung seiner personenbezogenen Daten nicht mehr einverstanden ist (z.B. beim Widerruf der Einwilligung oder beim Widerspruch gegen die Verarbeitung und keine anderweitige Rechtsgrundlage für die Verarbeitung vorliegt) , wenn die Informationen unrichtig sind (Erwägungsgrund 39 S. 11 zur DSGVO) oder wenn personenbezogene Daten als nicht mehr notwendig erachtet werden, kann er also die Löschung seiner Daten verlangen.

Dieses Recht ist jedoch nicht absolut, und Organisationen müssen diesem Wunsch nicht immer nachkommen. Gemäß Artikel 17 der DSGVO haben Einzelpersonen das Recht, dass ihre personenbezogenen Daten gelöscht werden. Dazu gehören alle Daten, die für den Zweck, für den sie ursprünglich erhoben oder verarbeitet wurden, nicht mehr benötigt werden.

Wenn der für die Verarbeitung Verantwortliche die personenbezogenen Daten einer Person der Öffentlichkeit zugänglich gemacht hat, muss er geeignete Maßnahmen ergreifen, um sicherzustellen, dass alle anderen für die Verarbeitung Verantwortlichen wissen, dass alle Verknüpfungen zu diesen personenbezogenen Daten sowie alle vorhandenen Kopien oder Replikate der personenbezogenen Daten gelöscht werden müssen. Wenn eine Person wie oben beschrieben nicht mehr mit der Verarbeitung ihrer personenbezogenen Daten einverstanden ist, kann sie bei Vorliegen der gesetzlichen Voraussetzungen verlangen, dass diese gelöscht werden. In einem solchen Fall muss die Organisation ihr Bestes tun, um die Daten zu löschen, wozu grundsätzlich auch gehört, dass sie Dritte, die die Daten in der Vergangenheit erhalten haben, benachrichtigt. Das Gleiche gilt, wenn personenbezogenen Daten unnötig gespeichert werden; sie hat dann grundsätzlich das Recht, auch deren Löschung zu verlangen.

Das Recht auf Vergessenwerden ist eingeschränkt, wenn es mit dem Recht auf freie Meinungsäußerung und Informationsfreiheit kollidiert. Wenn eine Person die Löschung ihrer personenbezogenen Daten verlangt, weil sie unrichtig sind, die Daten aber immer noch wahr sind, muss die Organisation sie nicht löschen. Das Recht auf Vergessenwerden ist ein wesentlicher Bestandteil der DSGVO, der dem Einzelnen mehr Macht über seine personenbezogenen Daten gibt. Es erlaubt den Menschen, die Löschung ihrer Daten zu verlangen, wenn sie für den Zweck, für den sie ursprünglich erhoben oder verarbeitet wurden, nicht mehr erforderlich sind oder wenn sie mit der Verarbeitung nicht mehr einverstanden sind.

Wie ChatGPT funktioniert
Um zu verstehen, welche Herausforderungen das Recht auf Vergessenwerden mit sich bringt, wenn es auf ein großes KI-basiertes Modell wie ChatGPT angewendet wird, müssen wir verstehen, wie das OpenAI-System funktioniert und welche Art von Daten es verwendet.

ChatGPT ist ein KI-gestützter Chatbot von OpenAI, der auf GPT-3.5 basiert. Er zeichnet sich durch seine menschenähnlichen Antworten bei Unterhaltungen aus. OpenAI Inc. ist eine Non-Profit-Organisation und die Muttergesellschaft des gewinnorientierten Unternehmens OpenAI LP, das ChatGPT entwickelt hat.

Bei der Entwicklung von ChatGPT wurde eine Verschmelzung von überwachtem und verstärktem Lernen eingesetzt. Das Sammeln von Daten für das überwachte Strategiemodell (das SFT-Modell) begann mit der Auswahl einer Liste von Prompts, gefolgt von der Zuweisung menschlicher Labeler, die die erwartete Antwort auf jeden Prompt aufschreiben sollten. Für ChatGPT wurden zwei Quellen von Prompts verwendet: einige wurden von den Labellern geschrieben oder vorgeschlagen, während andere aus den API-Transaktionen von OpenAI stammten. Dieser Prozess dauerte eine Weile und war recht kostspielig, doch das Ergebnis war ein vergleichsweise kleiner, aber erstklassig kuratierter Datensatz mit etwa 12-15k Datenpunkten, der die Grundlage für die Verfeinerung eines vortrainierten Sprachmodells bildete.

Um seine Leistung zu verbessern, wurde ChatGPT auch mittels Reinforcement Learning with Human Feedback (RLHF) trainiert. Diese Methode nutzt menschliches Feedback, um ChatGPT dabei zu helfen, zu lernen, wie man Anweisungen befolgt und Antworten produziert, die Menschen als zufriedenstellend ansehen würden. Die vom Programm gesammelten Daten werden verwendet, um Antworten auf Fragen und andere Materialien wie E-Mails, Aufsätze, Codeschnipsel und sogar Gedichte zu erstellen. Es ist auch nützlich für die Erstellung virtueller Assistenten und die schnelle Beantwortung von Kundenanfragen. OpenAI hat eine beeindruckende KI-Anwendung entwickelt, indem es Techniken des überwachten und des verstärkten Lernens miteinander verschmolzen hat, so dass der Chatbot Antworten wie ein Mensch generieren und Gespräche führen kann. Die von ChatGPT gespeicherten Daten können verwendet werden, um Antworten auf Gespräche und Anfragen zu generieren und um virtuelle Assistenten zu bilden, die schnell auf die Bedürfnisse der Kunden eingehen können.

ChatGPT ist kein Online-Bot, der das Internet nach Daten durchforstet. Vielmehr wurde er auf eine beträchtliche Menge an Text, wie z. B. Romane, Artikel und Websites, vortrainiert. Das bedeutet, dass er keine neuen Informationen aus dem Internet selbst sammelt. Vielmehr nutzt es die Daten, die es bereits kennt, um Antworten zu generieren. Viele persönliche Daten von Personen, über die im Internet häufig gesprochen wird, sind in seinem bereits vorhandenen Datensatz enthalten.

Wie genau funktioniert ChatGPT also? Es verwendet eine Methode des maschinellen Lernens, das so genannte Transfer-Lernen, bei dem ein Modell zunächst für eine datenintensive Aufgabe trainiert und dann auf eine andere Aufgabe abgestimmt wird. In diesem Fall wird das Modell anhand einer umfangreichen Sammlung von Wörtern aus dem Internet trainiert und dann auf die jeweilige Aktivität abgestimmt.

Leider kann ChatGPT auch falsche Antworten erzeugen. Diese "Halluzination", wie einige Wissenschaftler sie nennen, ist besonders bei medizinischen Ratschlägen gefährlich. Gefälschte Konten in sozialen Medien sind bereits ein Problem im Internet; Bots wie ChatGPT machen es noch einfacher, Betrug zu begehen. Und nicht nur das: Falsche Informationen könnten sich leicht verbreiten, wenn ChatGPT selbst ungenaue Antworten glaubwürdig erscheinen lassen kann.

DSGVO-Probleme
Die Schwierigkeit bei der Durchsetzung des Rechts auf Vergessenwerden gemäß Artikel 17 der DSGVO in Bezug auf generative KI wie ChatGPT liegt in der dauerhaften Natur der von diesen Systemen erzeugten Daten. Die Verarbeitung natürlicher Sprache wird verwendet, um Antworten aus den gesammelten Daten zu erstellen, was es nahezu unmöglich macht, alle Spuren der persönlichen Daten einer Person zu entfernen.

Unternehmen, die generative KI einsetzen, müssen sich nun der Komplexität des Löschens von Daten auf Anfrage bewusst sein, da dies ein gründliches Verständnis dafür erfordert, wie ihre KI-Systeme Antworten interpretieren und generieren. Dies erfordert ein Verständnis dafür, welche Daten zur Erstellung dieser Antworten verwendet werden, damit Unternehmen das Recht auf Vergessenwerden einhalten können.

Miguel Luengo-Oroz wollte wissen, ob neuronale Netze vergessen können. ChatGPT erklärte, dass KI-Systeme wie neuronale Netze nicht wie Menschen vergessen können. Stattdessen passt das Netzwerk seine Gewichte an, um sich besser auf neue Daten einzustellen, was bei gleichem Input zu anderen Ergebnissen führt. Das ist kein Vergessen im herkömmlichen Sinne, sondern das Netzwerk konzentriert sich einfach mehr auf die neuen Daten, die es sammelt. Alle Informationen bleiben jedoch erhalten. Dies kollidiert mit den Anforderungen von Art. 17 DSGVO.

In den Datenschutzrichtlinien von OpenAI wird erklärt, dass alle Daten vertraulich und auf die in den Vertragsbedingungen festgelegten Zwecke beschränkt bleiben. Sie garantieren auch, dass die erhobenen und verarbeiteten personenbezogenen Daten nicht an Dritte weitergegeben werden. Es ist jedoch ungewiss, ob dies auch für Daten gilt, die in Modellen künstlicher Intelligenz wie ChatGPT gespeichert sind.

Alexander Hanff, Mitglied des Europäischen Datenschutzausschusses (EDPB), bezweifelt die angebliche Datensammlung von OpenAI für ChatGPT. Er ist der Ansicht, dass das Sammeln von Milliarden oder Billionen von Datenpunkten von Websites mit Geschäftsbedingungen, die das Scraping durch Dritte verbieten, eine Verletzung der DSGVO darstellt. Darüber hinaus ist Hanff der Ansicht, dass ChatGPT ein kommerzielles Produkt ist und daher nicht unter die Fair Use-Regelung fällt.

Zum jetzigen Zeitpunkt ist es ungewiss, ob ChatGPT oder andere generative KI-Modelle das Recht auf Löschung" gemäß Artikel 17 der DSGVO befolgen können. Es müssen umfangreiche Untersuchungen durchgeführt werden, um die Rechtsvorschriften für die Nutzung von KI-Modellen zu ermitteln und durchzusetzen und so sicherzustellen, dass die Datenschutzrechte des Einzelnen geschützt werden. Ich persönlich bin jedoch nicht davon überzeugt, dass dieses spezielle KI-Modell die Anforderungen von Artikel 17 der EU-DSGVO erfüllen wird.

Spezialgebiete

Künstliche Intelligenz

Entspricht ChatGPT den Anforderungen der DSGVO? – Untersuchung des Rechts auf Vergessenwerden

Locations

Spezialgebiete

Verwandte Arbeitsbereiche