KI-Bildgenerierung: Alles nur geklaut?!

Sie heißen LAION-5B, Stable Diffusion, Midjourney, DALL-E 2 oder neuerdings DALL-E 3. Sie eint alle dasselbe Ziel: Bilder aus Text auf Basis maschinellen Lernens zu erstellen. Mal für freie Zwecke, meistens (und wenn es nur durch die Hintertür ist) für kommerzielle Zwecke. Die Modelle nutzen also künstliche neuronale Netzwerke, um aus Textanordnungen fotorealistische Bilder zu erstellen. Also eine künstliche Intelligenz (KI), die kreative Werke von sich aus erstellt?

Das Ganze ist diskussionswürdig, denn die kreative Leistung, die am Ende herauskommt basiert nicht nur auf denjenigen der den Text verfasst (Prompt), den technischen Finessen der Entwickler und der Serverleistung. Es basiert auch auf der Kreativität der Quellen, also den Fotografen, die die KI-Modelle manchmal freiwillig, aber meistens unfreiwillig mit ihren eigenen Schöpfungen und Kreativität trainiert haben.

KI und Urheberrecht: Wem gehören die Bilder?

Ein Kommentar: Ich bin kein Anwalt und dies ist kein Rechtstext. Dies ist einfach eine freie Meinungsäußerung als Journalist und Fotograf und insbesondere als Betroffener bzw. unfreiwilliger Trainer von KI-Modellen. Ich / wir beschäftigen uns nicht erst seit gestern mit dem Thema Künstliche Intelligenz, trotzdem hellhörig wurden wir durch die Klage des bekannten Stockfotografen und Blogger Robert Kneschke (www.alltageinesfotoproduzenten.de), der seine Bilder in einem Datensatz von LAION mittels der Suchmaschine „Have i been trained“ wiedergefunden hat und in einem Rechtsstreit nun dessen Löschung verlangt.

Also recherchierten wir selber und fanden insgesamt 30.000 Bilder in dem Datensatz, die von unseren hauseigenen Portalen (Bildagentur www.frontalvision.com und Sportmagazin www.turus.net) ohne Genehmigung „gescrapt“ und zum Training für verschiedene KI-Modelle bereitgestellt wurden. Dazu finden sich mehrere tausend Bilder von uns, die illegal auf anderen Seiten wie Pinterest veröffentlicht wurden und auch über den Webcrawl (Common Crawl) in den Datensatz LAION-5B aufgenommen wurden. Die Daten von LAION-5B wurden mittels eines Common Crawl zusammengestellt. So wurden Webseiten nach -Tags durchsucht und die Links zu den Bildern, aber auch die Alt-Tags und Title-Tags hinterlegt.

Wer ist LAION? LAION (Large-scale Artificial Intelligence Open Network) sieht sich laut Wikipedia selber als eine deutsche Non-Profit-Organisation, die Modelle und Datensätze für künstliche Intelligenz veröffentlicht. Liest sich interessant, aber was bedeutet Non-Profit in einer Welt wo die gescrapten Daten bei kommerziellen Drittanbietern landen? Ja genau die Datensätze landen bei kommerziellen Text-Bild-Modellen wie Stable Diffusion und dem Unternehmen Stable AI, die wiederum laut verschiedenen Medienberichten LAION unterstützen.

KI Bildgenerierung: Urheberrechtsproblem aus Fotografensicht / Künstler

Laut LAION, sind die Bilder selbst nicht in dem Datensatz hinterlegt, sondern nur die Links zu diesen. Anders als die Bildinformationen. Diese wurden und werden zum Trainieren verwendet und das sehen wir als Fotografen ebenso problematisch wie die Verwendung der Bilder.

Urheberrechtsproblem 1: Die Nutzung der Bilder ohne Genehmigung / Lizensierung

Kommen wir erst einmal zu den Bildern: Seit 2001 betreiben wir eine Bildagentur für Sportfotos und historische Bilder (Doku & Reisefotografie) sowie seit 2008 ein Sportmagazin mit großer Fotogalerie. Da vor allem bei der Bildagentur das Geschäftsmodell im Verkauf von Fotos besteht, wurde mit der Gründung in den Nutzungsbedingungen ganz klar die Verwendungsvoraussetzung von allen Bildern beschrieben. Diese sehen eine ausdrückliche Genehmigung (sprich kostenpflichtige Lizensierung) vor und eine Nutzung nur für den erworbenen Verwendungszweck. Auch ist eine Bearbeitung der Bilder nur nach gesonderter Genehmigung erlaubt.

Die Nutzungsbedingungen sind für beide Portale gleich. Eine Verwendung zum Trainieren von KI-Modellen mit dem Zweck KI-generierte Bilder mit gleichem Thema zu erstellen ist entsprechend nicht gestattet.

Trotzdem wurden unsere Seiten „gecrawlt“ und die Inhalte aus unserer Sicht unrechtmäßig zu verwenden. Einer derartigen Nutzung haben wir nicht zugestimmt, denn dies würde unser Geschäftsmodell – drastisch ausgedrückt – vernichten. Ein historisches Bild aus Berlin könnte sich jeder künftig kostenlos erstellen, anstatt von uns in „echt“ zu erwerben. Dazu sehen wir die Problematik von künftigen Rechtsstreits: Wessen Bild ist „originaler“ bei der Kommerzialisierung? Und warum dürfen Sportfotos von einer KI kommerziell genutzt werden, aber die „originalen“ Bilder nicht?

Eine Frage an LAION: Warum wurden nur relativ kleine Spezial-Fotoagenturen / Fotoseiten gescrapt oder genutzt? Bilder von IMAGO oder picture alliance finden sich nämlich nicht in dem Datensatz, jedenfalls nicht durch die Suche „Have i been trained“.

Urheberrechtsproblem 2: Die Nutzung der Alt- und Title Tags ohne Genehmigung

Die Beschriftung eines Fotos sowohl im Sportbereich, als auch in der anderweitigen Themenfotografie meist aufwendiger wie die Erstellung und Bearbeitung des Bildes selbst. Liegen in der Live-Sportfotografie meist die Fakten vor, bedeutet es beispielsweise bei historischen Bildern eine extrem aufwendige Recherche, wenn kaum Vorinformationen da sind.

So folgt noch eine persönliche geistige Schöpfung, um die Bilder in den Metadaten im perfekten Muster zu beschriften. Beispiel: Für manche historische Bilder habe ich Stunden gebraucht, um den genauen Standort zu ermitteln. Dann folgte die ausführliche zweisprachige Beschriftung, die auch in den HTML Tags „AlT“ und „Title“ ausgegeben wird. Das Urheberrecht an der Beschriftung liegt bei mir. Aber auch diese Inhalte wurden ohne Genehmigung mit dem Webcrawl – drastisch formuliert – geklaut!

Und damit zur Eingangsfrage: KI-Bildgenerierung Alles nur geklaut?!

Das Fragezeichen und Ausrufezeichen sagt alles.

Es gibt tatsächlich „faire“ Modelle wie beispielsweise von Adobe und neuerdings auch von Getty Images die nach eigenen Angaben nur mit ihren eigenen kreativen Werken KI-Modelle trainiert haben und bei der Kreation eines KI generierten Fotos die ursprünglichen Schöpfer entlohnen. Natürlich: Über die Höhe der Entlohnung ist an anderer Stelle zu diskutieren.

Bei anderen Modellen oder wie den Nutzern des von LAION zur Verfügung gestellten Datensatz LAION-5B (und wahrscheinlich anderer Datensätzen von anderen Anbietern) wo die kreativen Schöpfer nicht gefragt wurden, sondern sich einfach ohne Rücksprache und ohne Berücksichtigung der Nutzungsbedingungen an einem kreativen Fundus bedient wurde würde ich die Frage mit „Ja“ beantworten.

Was ist es denn anderes wenn man einfach Milliarden Fotos mitsamt den Metatags und weiteren Beschriftungen sich abgreift und dabei nicht nur die kreative Bildleistung, sondern auch die hochwertige journalistische Beschriftung zum Trainieren für kommerzielle Zwecke nutzt? Das ist nicht fair, sondern das ist aus meiner Sicht ganz klar Diebstahl des geistigen Eigentums.

Ja inzwischen kann man in der robot.txt der Webseite CommonCrawler / KI Bots aussperren. Aber warum muss man selber tätig werden? Warum wurde man nicht gefragt?

Fazit: Ich bin kein Rechtsexperte und dieser Text spiegelt nur meine bescheidene Meinung als Kreativer wider. Würde es die Möglichkeit geben, würde ich empfehlen alle Modelle zu reseten und nochmal bei null anzufangen. Dann aber richtig in Zusammenarbeit mit den Schöpfern kreativer Werke.

Update: Wie lapidar Unternehmen mit den Inhalten anderer umgehen zeigte auch jüngst Meta. So wurde einfach angekündigt künftig alle öffentlich auf den eigenen sozialen Netzwerken geposteten Bildern (Instagram, Facebook) zum Trainieren des eigenen KI-Modells zu nutzen. Was kann man da machen: Von den Diensten abmelden.