StyleGAN 2 bringt deutliche Verbesserungen zur ersten Generation mit.

Foto: Youtube/Two Minute Papers

Das Zeitalter der Deepfakes ist eingeläutet und wie so viele Technologien bringt sie viele Chancen, aber auch Herausforderungen mit. Während das Erstellen von glaubwürdigen Deepfake-Videos noch sehr schwer ist und viele Ressourcen braucht, ist man bei statischen Bildern schon deutlich weiter. Forscher von Nvidia haben ein neuronales Netzwerk namens StyleGAN entwickelt, das in der Lage ist, basierend auf vielen tausend Trainingsfotos selbst Gesichter zu erzeugen.

Nun haben Wissenschaftler des Chipherstellers und der Aalto-Universität in Helsinki die nächste Generation in einem Paper vorgestellt und auch den Quellcode veröffentlicht. Sie bringt neue Fähigkeiten mit und merzt Fehler ihres Vorgängers aus, erklärt Károly Zsolnai-Fehér in einem Video auf seinem Youtube-Kanal "Two Minute Papers". Er ist am Institut für Computergrafik und Algorithmen an der TU Wien tätig, wo er derzeit auch an seinem PhD arbeitet.

Two Minute Papers

Kein Zahnproblem mehr

Zugenommen hat unter anderem der Detailreichtum der Bilder. Und die Komplexität der Beschreibungen, die es verstehen an. In entsprechender Konfiguration kann StyleGAN verwendet werden, um aus Textanweisungen wie "Mann in gelber Warnweste arbeitet auf der Straße" ein Bild zu erzeugen, das man zumindest auf den ersten Blick für ein Foto halten könnte.

Bei Gesichtern hat die KI nun einige schlechte Angewohnheiten abgelegt. Bisher etwa plagte sie sich mit bestimmten Mustern. Besonders Zähne waren bisher ein Problemfall, weil das Netzwerk Änderungen des Betrachtungswinkels hartnäckig zu ignorieren pflegte. Das ist nun nicht mehr der Fall.

Autos, Kirchen, Katzen

Neben Menschen kann StyleGAN auch einige andere Dinge erschaffen. Beispielsweise Autos, Kirchen und – vor allem – Katzen. Die Stubentiger können mit verschiedenen Rasseausprägungen, Fellkolorationen und Augenfarben erstellt werden.

Wie die KI arbeitet und wie sie Szenen zerlegt, erklären die Forscher in einem Blogbeitrag. Das komplette Paper zur zweiten Generation findet sich auf Arxiv. Wer Ergebnisse der Gesichtserzeugung ansehen möchte, kann dies auf der Website "This Person Does Not Exist". Diese liefert bereits Ergebnisse, die von der neuen Generation des Netzwerks erzeugt werden. (gpi, 02.02.2020)