Nicht nur in der Handlung des Films "Matrix Resurrections", sondern auch bei seiner Entstehung verschwimmen die Grenzen zwischen Realität und Fiktion.

Foto: Warner Bros./Matrix Resurrections

Im August wurde bekannt, dass Wiens Bürgermeister Michael Ludwig ein Videotelefonat mit Kiews Bürgermeister Witali Klitschko geführt hatte – jedoch mit dem Haken, dass die Person am anderen Ende der Leitung gar nicht der zum Politiker gewordene Profiboxer war. Dahinter steckte das russische Komikerduo "Vovan und Lexus", das erst kürzlich den polnischen Präsidenten Andrzej Duda mit einem gestellten Anruf von Emmanuel Macron narrte. Die beiden arbeiten für die Videoplattform Rutube, die zum Gazprom-Konzern gehört.

Auch wenn in beiden Fällen keine Deepfakes zum Einsatz kamen, sorgen die Aktionen des Duos immer wieder für Diskussionen rund um das auch gefährliche Potenzial der Technologie.

Hollywood-Tech made in Germany

Mit dem Potenzial von Deepfakes kennt sich auch Sven Bliedung von der Heide gut aus. Er ist CEO von Volucap, einem deutschen Unternehmen, das sich die Entwicklung des "Deepfake-Goldstandard" für Kinoproduktionen auf die Fahnen schreibt. DER STANDARD konnte im Rahmen des XR Day in Bonn mit ihm sprechen.

Das 2018 gegründete Unternehmen hat sich darauf spezialisiert, volumetrische Aufnahmen von Darstellern in extrem hoher Auflösung zu erzeugen. Dazu werden die Schauspieler aus zahlreichen Perspektiven mit eigens für den Zweck konstruierten Kamera-Arrays aufgenommen, wobei man mit Auflösungen von bis zu 3.500 Megapixeln arbeitet.

Ein Showcase-Clip in eigener Sache von Volucap.
Volucap

Als Ergebnis entsteht dann ein animiertes 3D-Modell, auch "Volucap" genannt, das sich in Filmszenen einfügen lässt, ohne dass für den Betrachter diese "Virtualisierung" sichtbar ist. Bei der Implementation bedient man sich auch der Hilfe einer eigens trainierten KI, die es etwa ermöglicht, optische Merkmale, wie Gesichter mehrerer Schauspieler, in ein Modell zu übertragen und in Kamerafahrten auch Perspektiven abzubilden, die gar nicht aufgenommen worden sind.

Diese Dienste werden mittlerweile auch von Hollywood in Anspruch genommen. Zum Einsatz kamen sie etwa in "Matrix Resurrections", das Ende 2021 in die Kinos startete. Zudem verwirklichte man dafür erstmals überhaupt ein Unterwasserstudio für volumetrische Aufnahmen.

Mit Musk im Videocall

Am XR Day war man aber nicht nur, um die eigenen Filmverdienste zu präsentieren. Zur Eröffnungskeynote schwärmte Deutschlands wohl bekanntestes Supermodel in einer Videobotschaft von den Potenzialen von Virtual Reality und Augmented Reality. Die täuschend echt wirkende Aufnahme entpuppte sich allerdings als aufwendiges Deepfake von Volucap.

Zur weiteren Demonstration des Möglichen brachte man auf die Messe auch Echtzeit-Deepfakes mit. In Videocalls per Handy konnte man sich dort das Gesicht verschiedener bekannter Persönlichkeiten "aufsetzen" lassen. Die Bandbreite reichte von Darstellerinnen und Darstellern wie Emma Watson oder Sylvester Stallone über Politiker wie Donald Trump, den deutschen Komiker Dieter Hallervorden bis hin zum Enfant terrible der Techbranche, Elon Musk.

Das Elon-Musk-Echtzeit-Deepfake in Aktion (abfotografiert vom Bildschirm am Messestand).
Foto: DER STANDARD/Pichler

Der Wechsel von einem Antlitz zum nächsten dauert nur wenige Sekunden, und die Glaubwürdigkeit variiert freilich auch mit der Kompatibilität der Gesichtsmerkmale des jeweiligen Promi und seiner "Leinwand".

Die Fotos in diesem Artikel tragen dem Resultat dabei nicht gut Rechnung. Denn so manche der Fälschungen wären trotz der niedrigen, aber für Webcams durchaus glaubwürdigen Auflösung in einem Videochat extrem schwer als solche zu identifizieren, wenn es sich nicht um Musk oder Watson, sondern etwa ein Familienmitglied handeln würde. Beim Lächeln tauchen Grübchen auf, auch das Drehen des Kopfes sorgt nicht für perspektivische Verzerrungen oder andere visuelle Probleme.

Awareness

Öffentlich zur Verfügung stellt man derlei Technologie freilich nicht, sagt der Volucap-CEO, der Risiken, etwa des Einsatzes für Betrug oder Desinformation, ist man sich bewusst. Man entwickelt sie ausschließlich gezielt für Kunden für den künstlerischen Einsatz.

Demos wie diese sollen laut Bliedung von der Heide auch Aufmerksamkeit dafür schaffen, was bereits möglich ist. Menschen müssten lernen, dass sie den Bildern, die sie online sehen, nicht unbedingt vertrauen können und jemand, der in einem Videochat aussieht wie ein Familienmitglied, nicht die Person sein muss, die sie angibt zu sein. Derzeit sind viele Deepfakes aber noch beschränkt und es ist einfach, sie zu erkennen. Etwa aufgrund grafischer Fehler oder weil bestimmte Dinge noch nicht gut funktionieren, etwa die perspektivische Anpassung, wenn man den Kopf zur Seite dreht.

Der Autor dieser Zeilen als "Sly" Stallone.
Foto: DER STANDARD/Pichler

Im Moment stellt die Umsetzung von Deepfakes, wie Volucap sie liefern kann, auch noch beträchtlichen Aufwand dar. Die Technologie bleibt aber nicht stehen. Die Hürden von heute könnten schon in wenigen Jahren überwunden sein. Dadurch, dass die KI-Systeme, die für die Übertragung der Gesichter zuständig sind, dadurch lernen, indem sie gegen sich selbst spielen (General Adversarial Network), besteht aber auch die Möglichkeit, die gleichen Fortschritte zu nutzen, um Erkennungstools zu bauen.

Es ist nach Ansicht des Volucap-Chefs aber nicht realistisch davon auszugehen, dass künftig jeder Internetnutzer auf seinem PC, Tablet oder Smartphone selbst über solche Software verfügt. Dementsprechend hält er es für wichtig, dass Plattformen wie Youtube und Facebook entsprechende Prüfmechanismen für Mediendateien in ihre System integrieren. Der Kampf gegen Betrug und Desinformation mit Deepfakes, auf den die Gesetzgeber vielerorts nicht gut vorbereitet sind, wird letztlich die Hilfe von "Big Tech" benötigen. (gpi, 25.11.2022)