Der EU AI Act, ein Gesetz zur Regulierung von Künstlicher Intelligenz (KI) in Europa, sorgt für Aufsehen und könnte die Zukunft von KI-generierten Inhalten nachhaltig beeinflussen. Die Entwickler von KI-Plattformen wie ChatGPT, Stable Diffusion und Midjourney stehen vor einer möglichen Herausforderung, da das Gesetz verlangt, dass sie den Einsatz urheberrechtlich geschützter Trainingsdaten offenlegen. Und das könnte erst der Anfang sein.
Seit 2021 arbeiten die EU-Gesetzgeber am AI Act und haben nun gezielt Vorschläge zur Regulierung von generativen KI-Plattformen eingearbeitet. Dieses Gesetz könnte weitreichende Auswirkungen auf die zukünftige Entwicklung von KI-Technologien haben.
Ein wichtiges Detail des EU AI Act betrifft die Offenlegung urheberrechtlich geschützter Trainingsdaten. Unternehmen wie Stability AI und Midjourney haben bisher nicht vollständig offengelegt, welche Daten sie für die Entwicklung ihrer KI-Modelle verwendet haben. Das könnte jetzt zum Problem werden, denn der AI Act verlangt genau das.
Die EU-Gesetzgeber haben bereits vorgeschlagen, Stability AI als „hochriskant“ einzustufen – eine Kategorie, die auch für ChatGPT, das auf OpenAIs GPT-4 basiert, gelten könnte. OpenAI hat bisher nur wenig Informationen darüber preisgegeben, wie GPT-4 trainiert wurde, insbesondere welche Daten dafür verwendet wurden.
Diese mangelnde Transparenz hat bereits zu rechtlichen Auseinandersetzungen geführt. So stehen derzeit Klagen gegen Stability AI an, darunter eine von Getty Images und eine Sammelklage von Künstlern, die den Missbrauch urheberrechtlich geschützter Bilder anprangern.
Fazit:
Die Zukunft von KI-generierten Inhalten könnte durch den EU AI Act eine entscheidende Wendung nehmen. Unternehmen wie OpenAI, Stable Diffusion und Midjourney müssen ihre Trainingsdaten offenlegen und sicherstellen, dass sie keine urheberrechtlich geschützten Inhalte verwenden. Andernfalls könnten sie mit strengen Auflagen oder sogar einem Verbot in der EU konfrontiert werden.
Dieser fortschreitende Rechtsrahmen dürfte dazu führen, dass KI-Plattformen in Zukunft vorsichtiger mit ihren Trainingsdaten umgehen müssen. Die Verwendung öffentlich zugänglicher Daten ohne Zustimmung der Urheber könnte in dieser neuen Ära der KI-Regulierung nicht mehr ausreichen. Es bleibt abzuwarten, wie die betroffenen Unternehmen auf diese veränderten Bedingungen reagieren werden und welche Auswirkungen dies auf die gesamte KI-Branche haben wird. Ist eine Konsequenz daraus die zunehmende Rolle von synthetischen Trainingsdaten? KIs, die KIs trainieren?
Kommentar von Georg Neumann dazu:
Ja, Urheberrecht ist wichtig. Aber setzen wir dafür aufs Spiel, den technologischen Anschluss an globale Entwicklung vollends zu verspielen? Ich hoffe hier kann zeitnah eine Lösung gefunden werden, denn grundsätzlich muss erst einmal geklärt werden, ob urheberrechtlich geschütztes Material nicht doch für Trainingsdaten verwendet werden darf, da durch die neuronalen Netze keine Kopie des Werks erstellt werden kann. Damit wären viele der aktuellen Argumente entkräftet. Wenn dies aber scheitert, gibt es nur einen Sieger: Adobe. Denn Adobe Firefly setzt beim Training der Sensei Modelle auf rein gemeinfreies Bildmaterial und Adobe Stock Material, für dessen Nutzung die Nutzer zugestimmt haben (wenn auch meist nicht wissentlich).
Bild: Stable Diffusion XL Beta. Prompt: A baby in a golden armor holding a sign that says „EU AI Act“