Während Google sein bisher mächtigstes KI-Modell Gemini vorgestellt hat, ist auch Meta – der Mutterkonzern von Facebook, Whatsapp und Instagram – mit neuen KI-Tools an die Öffentlichkeit getreten. Insgesamt werden derzeit über 20 unterschiedliche Wege getestet, wie Generative KI die Erfahrungen auf den genannten Plattformen verbessern kann, heißt es in einem aktuellen Blogpost des Unternehmens. Die wohl interessantesten Neuerungen drehen sich dabei um einen KI-Bildgenerator im Stil von Dall-E, Midjpourney oder Stable Diffusion, der auf den Namen Imagine hört.

Imagine wird ausgebaut

Zuvor war der Bildgenerator für Menschen in den USA in Instagram und im Facebook Messenger verfügbar, hier konnten sich die Nutzerinnen und Nutzer in den Chats bereits gegenseitig KI-generierte Bilder schicken. Nun wird es auch möglich sein, mit einer Funktion namens "Reimagine" die KI-generierten Bilder der Freundinnen und Freunde zu adaptieren. Schickt also jemand in einem Gruppenchat ein Bild von einem Nilpferd, das Spaghetti isst, so kann man dieses mit einem neuen Prompt in ein italienisches Restaurant versetzen.

Meta

Zusätzlich nimmt Meta dieses System und stellt damit einen Stand-alone-Bildgenerator zur Verfügung, der im Stil der eingangs erwähnten Konkurrenzprodukte funktioniert: Die Beschreibung des gewünschten Bildes wird in einem Textfeld eingegeben, anschließend werden vier Ergebnisse ausgegeben. Der KI-Bildgenerator ist unter diesem Link verfügbar. Vorerst ist der Nutzerkreis offiziell auf die USA eingeschränkt, via VPN konnte DER STANDARD jedoch problemlos darauf zugreifen. Benötigt wird außerdem ein Meta-Konto, allerdings kann jedes bestehende Facebook- oder Instagram-Konto in ein solches umgewandelt werden.

Bei den ausgegebenen Bildern handelt es sich um Jpeg-Dateien, die im quadratischen Format mit 1.280 x 1.280 Pixel ausgegeben werden. Vielen Ergebnissen ist anzusehen, dass sie mit einer KI generiert wurden. Andere, wie das nachfolgende Bild einer Ente, die einen Hamburger isst, könnten beim raschen Scrollen durch den Instagram-Feed schon für echt gehalten werden.

Screenshot/Stefan Mey

Um die Gefahr etwaiger Täuschungen einzudämmen – Stichwort Deepfakes –, stattet Meta die Bilder schon jetzt mit einem sichtbaren Wasserzeichen in der Bildecke links unten aus. In Zukunft soll dieses durch ein unsichtbares Wasserzeichen ergänzt werden, das nicht mit klassischen Bildbearbeitungstools entfernt werden kann und laut Meta auch dann noch bestehen bleibt, wenn man einen Screenshot vom ursprünglichen Bild anfertigt. Das unsichtbare Wasserzeichen soll mithilfe eines Deep-Learning-Modells implementiert werden, welches das Wasserzeichen wiederum auch auslesen kann, während es für das menschliche Auge unsichtbar bleibt.

Interessant ist auch, dass Imagine im Test die Bildgenerierung mit prominenten Personen verweigert: Zu "Donald Trump" gab es ebenso keine Ergebnisse wie zu "Angela Merkel". Sehr wohl ist es aber möglich, Bilder von fiktiven Charakteren zu generieren, etwa die Hunde der "Paw Patrol". Bezüglich Jugendschutz ist man hier nicht sonderlich zimperlich: Auf Wunsch trinkt Polizeihund Chase auch gerne einmal ein Bier oder hält eine Waffe in der Hand.

Meta Imagine / Stefan Mey
Meta Imagine / Stefan Mey

Trainingsdaten von 1,1 Milliarden Postings

Jedoch dürfte neben dem Jugendschutz – diese Thematik gibt es auch bei anderen Anbietern – noch ein anderes Thema rund um Imagine beziehungsweise das zugrundeliegende Grundlagenmodell namens Emu für Aufsehen sorgen: jenes der Trainingsdaten. So schreibt das IT-Fachmedium "Ars Technica" mit Verweis auf einen Beitrag von Reuters, dass zum Trainieren des Modells 1,1 Milliarden öffentlich gepostete Bilder von Facebook und Instagram verwendet wurden. Nick Clegg, Präsident für Global Affiars bei Meta, hatte Ähnliches bereits im Rahmen der Meta Connect 2023 gesagt.

Der Ansatz unterscheidet sich sehr von jenem anderer Anbieter, zumal diese meist frei zugängliche Daten aus dem World Wide Web zum Trainieren ihrer Modelle absaugen – und das großteils ohne explizite Zustimmung der Urheberinnen und Urheber. Meta hingegen hat nicht nur Zugriff auf die Bilder seiner Userinnen und User, sondern auch auf die dazugehörigen Metadaten.

Nachdem täglich allein auf Instagram 95 Millionen Postings veröffentlicht werden, wurden in den Trainingsdaten offensichtlich nicht alle Bilder, sondern bloß ein Bruchteil davon verwendet. Auch heißt es seitens von Meta, dass nur öffentliche Postings in die Trainingsdaten einfließen. Wer also künftig davon ausgeschlossen werden möchte, der sollte die Sichtbarkeit seiner Beiträge entsprechend ändern. Damit ist man vorerst auf der sicheren Seite, sofern Meta dies nicht in den eigenen AGBs und Datenschutzrichtlinien ändert.

Chatbots und Videobearbeitung

Hinzu kommt, dass Meta nun in den USA jene 28 KI-Chatbots verfügbar macht, die auf Prominenten wie Paris Hilton, MrBeast, Kendall Jenner, Tom Brady, Charli D'Amelio und Snoop Dogg basieren. US-Einwohner können sich also ab jetzt mit den virtuellen Abbildern dieser Menschen in Apps wie Whatsapp, Instagram und dem Facebook Messenger unterhalten. Außerdem werden manche der KI-Bots via Bing nach Informationen im Web suchen können und verfügen zudem über ein besseres "Langzeitgedächtnis", können in neuen Konversationen also Bezug auf vorherige Aussagen nehmen. Wann die Bots nach Österreich und Deutschland kommen, ist nicht bekannt.

Der Bot von Meta AI kann sich überdies nun auch in Form von Reels, ergänzend zu Textbeiträgen, in Konversationen einbringen. Das Bildmaterial soll nach Metas Vorstellung etwa helfen, wenn man in einem Gruppenchat gemeinsam eine Reise plant.

Bereits im November hatte Meta außerdem gezeigt, wie auf Basis des Grundlagenmodells Emu das Erstellen von Videoinhalten leichter fallen soll, ebenso wie das Bearbeiten von Bildern auf Basis einfacher Textbefehle. Der Videogenerator kann unter diesem Link ausprobiert werden, die Bildbearbeitung unter diesem Link. (Stefan Mey, 7.12.2023)