Die Financial Times angekündigt ein Deal mit OpenAI am Montag um seinen Weltklasse-Journalismus zu der Ausbildung und Information zu lizenzieren ChatGPTs Modelle. Damit schließt es sich Axel Springer und Associated Press an, die ähnliche Abkommen abschlossen , wo OpenAI bietet angeblich Millionen für das Recht zur Nutzung von Inhalten. ChatGPT wurde jedoch an vielen anderen aus dem Web gesammelten Inhalten trainiert, für die OpenAI nicht bezahlt hat. Warum zahlt OpenAI also für manche Datensätze und für andere nicht?
Die Lizenzverträge von OpenAI scheinen eine klare Botschaft zu vermitteln: Wir werden Ihre Inhalte sowieso verwenden, also schließen Sie einen Vertrag mit uns ab, oder Sie bleiben auf der Strecke. Der Hauptvorteil eines Lizenzvertrags scheint eine prominente Stelle in den Antworten von ChatGPT zu sein. Einige Herausgeber möchten vielleicht auch eine Beziehung zum nächsten großen Informationsvertriebskanal festigen, bevor dieser die Oberhand gewinnt. Es scheint jedoch, dass OpenAI ohnehin viele Inhalte von Herausgebern verwendet.
OpenAI trainiert seine KI-Modelle bereits teilweise auf “öffentlich zugängliche Daten“, so CTO Mira Murati, was absichtlich vage erscheint. Was sind überhaupt öffentlich verfügbare Daten? Der Satz geht davon aus, dass alles, was im Internet kostenlos gelesen werden kann, auch kostenlos in ChatGPT integriert werden kann. Beispielsweise ist Gizmodo Teil der „öffentlich verfügbaren Daten“ von OpenAI. Unsere Website wurde über einen Zeitraum von über einem Jahr zwischengespeichert. 34.000 Mal auf GPT-2s WebText Datensatz, der letzte Datensatz, den OpenAI offengelegt hat, der zum Trainieren eines KI-Modells verwendet wurde.
Gizmodo ist für Leser kostenlos, hauptsächlich aufgrund der Werbung auf dieser Webseite. Wenn Leser über ChatGPT auf unsere Inhalte zugreifen können, bricht das unser Geschäftsmodell. Die New York Times, die im WebText-Datensatz von GPT-2 deutlich häufiger verwendet wird, verklagte OpenAI wegen Urheberrechtsverletzung über diese Angelegenheit.
Ein Content-Lizenzvertrag mit OpenAI scheint für Verlage die einzige Möglichkeit zu sein, im KI-Zeitalter relevant zu bleiben. PressemitteilungJohn Ridding, CEO der Financial Times Group, sagt, dieser Deal werde „die Reichweite“ ihrer Arbeit erweitern und gleichzeitig „erste Einblicke darin bieten, wie Inhalte durch KI an die Oberfläche gelangen“.
„Das Ding an KI ist, dass es sich nicht wirklich um künstliche Intelligenz handelt“, sagte Matthew Butterick, ein Anwalt, der Sarah Silverman und andere Buchautoren vertritt, die OpenAI verklagen, in einem Interview mit Gizmodo. „Es ist menschliche Intelligenz, die an einem Ort geerntet und von ihren Schöpfern getrennt wurde. Dann versieht dieses große Technologieunternehmen sie mit einem Preisschild und verkauft sie an jemand anderen.“
Butterick ist Kläger in sechs Urheberrechtsklagen gegen KI-Unternehmen. Da er auch Autor, Programmierer und Designer ist, weiß er nach eigener Aussage, wie KI diese Branchen bedrohen kann. Im Allgemeinen drehen sich seine Fälle um die Behauptung, dass KI die Arbeit der Entwickler nutzt und gleichzeitig deren Existenzgrundlage bedroht.
Die Lizenzverträge von OpenAI sorgten für Aufsehen hinsichtlich der Inhalte, die ChatGPT kostenlos nutzt. Technologieunternehmen argumentieren, dass generative KI eine „faire Nutzung“ urheberrechtlich geschützter Werke darstelle, da sie diese in etwas Neues verwandle. In der KI-Welt wird zudem argumentiert, dass sie ein ähnliches Modell wie Google Search verwende, das urheberrechtlich geschützte Inhalte zwischenspeichert, um ein nützliches Tool zur Informationssuche zu erstellen. Ähnlich wie Google haben KI-Chatbots vor Kurzem damit begonnen, Hyperlinks einzubinden. Letztendlich muss ein Gericht entscheiden, ob generative KI eine „faire Nutzung“ darstellt.
OpenAI antwortete nicht sofort auf die Bitte um einen Kommentar von Gizmodo.
Buchautoren und -verleger scheinen nicht die einzigen zu sein, von denen OpenAI Inhalte zu übernehmen scheint. Die New York Times berichtete kürzlich, dass OpenAI GPT-4 auf über eine Million Stunden transkribierter YouTube-Videos. Tage vor Veröffentlichung des Berichts erklärte der CEO von YouTube, die Verwendung seiner Videos für KI-Training wäre ein „klarer Verstoß“ gegen seine Richtlinien.
Die Content-Lizenzverträge von OpenAI trüben die Diskussion. Das Unternehmen nutzt Internetinhalte auf irgendeine Weise kostenlos, bezahlt aber gleichzeitig andere für ihre Arbeit. Andere Technologieunternehmen wie Apple sind Berichten zufolge proaktiver, was die Bezahlung aller ihrer Trainingsdaten angeht. Adobe zahlte Berichten zufolge 3 $ pro Videominute um seinen KI-Videogenerator zu trainieren.
Es ist jedoch unklar, ob selbst eine einmalige Zahlung für den Erhalt von KI-Trainingsdaten ausreicht. Wir sprechen von einem Tool, das die Medienbranche für Autoren, Audio- und Videoproduzenten und mehr möglicherweise auf den Kopf stellen könnte. Der Abschluss eines Vertrags mit OpenAI könnte Ihnen einen guten Platz in den Ergebnissen von ChatGPT garantieren, aber es scheint, als hätte der KI-Chatbot Ihre Inhalte trotzdem verwendet. Zumindest im Moment sind KI-Unternehmen daran interessiert, alles im Internet zu verwenden und später Fragen zur Rechtmäßigkeit des Ganzen zu stellen.
Eine Version dieses Artikels erschien ursprünglich auf Gizmodo.
Dieser Inhalt wurde maschinell aus dem Originalmaterial übersetzt. Aufgrund der Nuancen der automatisierten Übersetzung können geringfügige Unterschiede bestehen. Für die Originalversion klicken Sie hier