"A robot painter drawing a painting", lautete der Input für dieses von der KI "Midjourney" generierte Bild.

Foto: DER STANDARD/Pichler/Midjourney

Es ist nicht jeder gesegnet mit zeichnerischem Talent. Aber jeder hat Fantasie. Und mit dieser Fantasie lässt sich einiges anfangen, selbst wenn man daran scheitert, einfache Motive händisch zu Papier zu bringen. In den letzten Monaten sorgten Kunstwerke für Erstaunen, in deren grafische Erstellung kein Mensch involviert war.

So etwa das Werk Théâtre D’opéra Spatial von Jason Allen. Er ist eigentlich kein Maler, sondern Chef einer Spielefirma. Sein auf Leinwand gedrucktes Bild zeigt einen futuristischen Thronsaal mit in langen Kleidern gehüllten Adeligen, die durch ein großes, rundes Fenster auf eine Stadt herabblicken. Es sieht aus, als wäre es mit tausenden Pinselstrichen verwirklicht worden, tatsächlich aber hatte es die auf Bilder spezialisierte künstliche Intelligenz (KI) "Midjourney" auf seine Kommandos hin erschaffen. Das Bild gewann auf der letzten Landesausstellung von Colorado den Bewerb für digitale Kunst, was prompt eine Diskussion auslöste. Ist ein Werk, bei dem kein Mensch direkt Hand angelegt hat, im Sinne der "Schöpfungshöhe" überhaupt Kunst? Und ist es fair, es mit Bildern zu vergleichen, für die Handarbeit geleistet wurde?

Das sind nur zwei der Fragen, die dieses mächtige Werkzeug aufwirft. Und "Midjourney" ist nicht die einzige Software dieser Art. Unter Namen wie "Dall-E", "Stable Diffusion" oder "Imagen" existieren noch andere künstliche Intelligenzen, die Kunstwerke auf Kommando erzeugen. Sie sind teilweise kommerziell verfügbar, gar nicht für die Öffentlichkeit zugänglich, oder können – wie im Fall von "Stable Diffusion", das eine quelloffene Adaption von "Dall-E" ist – von jedem frei genutzt werden. Dass im Netz immer mehr KI-generierte Bilder auftauchen, ist also kein Zufall.

Lernen en masse

Doch wie funktionieren diese Wunderwerke der Softwaretechnologie überhaupt? Grundsätzlich bestehen sie aus sogenannten neuronalen Netzwerken, die in ihrer Funktion versuchen, Gehirne zu emulieren. Sie werden von den Entwicklern mit grundlegenden Einstellungen ausgestattet, die auf das jeweilige Ziel zugeschnitten sind und Anweisungen darüber enthalten, was sie lernen sollen.

Hier sollte Googles Bilder-KI "Imagen" einen Waschbärastronauten, der aus dem Fenster blickt, generieren. Die Prüfung hat sie mit Bravour bestanden.
Foto: Google

Anschließend werden sie mit Daten gefüttert, die sie gemäß ihren Instruktionen mittels Maschinenlern-Algorithmen auswerten. Im Falle der Bilder-KIs kommen dabei Millionen an Wort-Bild-Paaren zum Einsatz. Also Bilder mit beigestellter Beschreibung, die festhält, was zu sehen ist. Das ermöglicht es der KI, Konzepte zu erlernen, welche Formen, Farben und Anordnungen bestimmte Dinge haben. Und sie können auf diesem Wege auch stilistische Informationen gewinnen, etwa darüber, wie ein altes Foto oder ein Ölgemälde typischerweise aussieht. Das gilt auch für die einzigartigen Zeichenstile verschiedener Künstler. Je mehr Beispiele für ästhetische Besonderheiten in den Lerndaten vorhanden sind, desto fehlerfreier kann die KI sie später bei beliebigen Motiven emulieren. Dieser sogenannte Style-Transfer ermöglicht Nutzern später etwa Eingabemöglichkeiten wie "eine Mondbasis im Stile von Rembrandt". Mit richtig formulierten Befehlen und etwas Verständnis für andere Feineinstellungen lassen sich teilweise beeindruckende Werke erschaffen.

Copyright und Deepfakes

Die Mächtigkeit der Bilder-KIs wirft aber nicht nur Fragen der künstlerischen Leistung auf. Sondern auch ihres Missbrauchspotenzials. Im Moment lassen sich etwa generierte Gesichter und fotorealistische Szenen bei genauem Hinschauen noch gut von echten Aufnahmen unterscheiden. Und wer Bilder in hoher Auflösung erzeugen möchte, benötigt viel Rechenleistung und Zeit. Die Entwicklung bleibt aber natürlich nicht stehen. Der Schritt zu fotorealistischen Bildern und – als logische Folge – Videos ist nur eine Frage der Zeit.

In den nächsten Jahren könnte auch die Frage des Urheberrechts relevant werden. Erste Künstler haben sich bereits unerfreut gezeigt, dass KIs ihren Zeichenstil imitieren können. In den Datensätzen, von denen "Midjourney" und Co gelernt haben, befinden sich auch zahlreiche geschützte Werke. Und so wird bereits über die Frage diskutiert, ob damit die Erzeugnisse der KIs als Derivate angesehen werden müssten, die potenziell das Urheberrecht verletzen. Die Problemstellung ist komplex. Eine Antwort werden vielleicht die Gerichte finden müssen. (Georg Pichler, 17.11.2022)