Neue KI-Tools wie Chat GPT oder Midjourney sind eine Kiste voller Überraschungen. Sämtliche Illustrationen auf dieser Seite haben wir mit Midjourney generiert.
Foto: DerStandard/martinjan/Midjourney

Hier schreiben Menschen. Das ist wichtig zu sagen bei einem Artikel, in dem es um künstliche Intelligenz geht. Denn Medienleute machen sich seit einiger Zeit einen Spaß daraus, den ersten Absatz eines Artikels über KI von einer KI selbst generieren zu lassen – und niemand hat es gemerkt.

Düstere Prognosen

In den vergangenen Monaten ist der Hype um künstliche Intelligenz geradezu explodiert. Das Internet wird mit bunten, künstlich generierten Bildern geflutet, eine Software namens Chat GPT produziert verblüffend menschliche Texte. Grafiker, Journalistinnen, Texter, Anwältinnen, Sekretäre – kaum ein Schreibtischjob wurde von düsteren Prognosen verschont, die diese Berufe bald von Computern ersetzt sehen. Gleichzeitig grübeln Lehrer und Uni-Lektorinnen, wie sie künftig überprüfen können, ob Hausübungen und Seminararbeiten aus menschlicher Feder stammen. Was ist da plötzlich passiert, und was kommt da noch auf uns zu?

Künstliche Intelligenz ist per se nicht neu. Beforscht und entwickelt wird sie bereits seit Jahrzehnten – mit stetigen Fortschritten. Das Paradox: Je weiter sich künstliche Intelligenz entwickelt, desto weniger nehmen wir sie wahr. Als 1997 erstmals ein Schachcomputer einen amtierenden Schachweltmeister schlug, waren das große Neuigkeiten, heute ist das ein alter Hut. Als Gesichtserkennung erstmals brauchbare Ergebnisse lieferte, war die Überraschung groß, heute entsperren wir unser Smartphone dutzende Male täglich per Face-ID. Mit jeder weiteren Entwicklung in der KI erscheinen uns frühere Meilensteine plötzlich nicht mehr intelligent. Forschende nennen das den KI-Effekt.

Foto: DerStandard/martinjan/Midjourney

Algorithmen mit Wow-Effekt

KI-Anwendungen waren in der Regel praktische Fachidioten. Gesichter erkennen, Sprache transkribieren, persönliche Video-Empfehlungen – das alles mag das Leben leichter machen, doch der Wow-Effekt blieb aus. Das änderte sich vergangenes Jahr, als der Chatbot Chat GPT und Bildgeneratoren wie Stable Diffusion oder Midjourney auftauchten.

Plötzlich ist nur noch die eigene Fantasie die Grenze. Ein Bild einer futuristischen Metropole im Stile mittelalterlicher Gemäldekunst? Ein Gedicht zur Mondlandung, so geschrieben, als stammte es aus der Feder von Shakespeare? Eine kurze Eingabe genügt, und die Maschine schreitet zur Tat.

Wer ein bisschen programmieren kann oder sich Code-Schnipsel zusammenkopierte, konnte die neuesten KI-Entwicklungen bereits seit Jahren testen. Doch selbst die kürzeste Zeile Code ist für die meisten eine zu große Hürde.

Foto: DerStandard/martinjan/Midjourney

Das neue iPhone

Warum gerade Bilder- und Text-KIs so ins Gespräch gekommen sind, ist deshalb leicht zu erklären. Das Revolutionäre an den Tools ist nicht nur die KI, die in ihnen arbeitet, sondern auch die Benutzerfreundlichkeit. Sie generieren Werke, die für jeden greifbar sind, und können auch von jedem genutzt werden. Der Bildgenerator Midjourney ermöglicht es, den eigenen Dienst auszuprobieren, und verkauft ein Abo mit umfangreicherem Zugriff. Mit Stable Diffusion gibt es gar eine quelloffene Bilder-KI, die man kostenlos nutzen kann – einen passend ausgestatteten PC vor ausgesetzt. Auch mit Chat GPT konnte man experimentieren, ehe die Entwickler von Open AI aufgrund des Ansturms den Zugang begrenzen mussten.

Manche vergleichen Chat GPT und Konsorten bereits mit dem iPhone. Apple hat zwar nicht das Smartphone erfunden, aber es benutzerfreundlich, hip und damit groß gemacht. Das Gleiche könnte für Chat GPT und KI gelten.

E-Mails ex machina

Denn bereits nach kürzester Zeit werden die Programme für eine Vielzahl von Aufgaben eingesetzt: Die KIs fungieren etwa als Chatbots im Kundensupport, die Problemlösungen ganz ohne menschliche Intervention aufzeigen oder Hilfesuchende wenigstens an die richtige Stelle vermitteln. Sie können auch helfen, Marketingtexte zu verfassen, oder Journalisten Inputs für knackigere Überschriften liefern. Bilder-KIs lassen sich als Inspirationsquelle nutzen, liefern Symbolbilder für Berichterstattung und illustrieren Bücher, die sonst unbebildert geblieben wären.

Das dürfte erst der Anfang sein. Microsoft, einer der Hauptfinanciers der Organisation Open AI, die unter anderem Chat GPT und den Bildgenerator Dall-e entwickelt, überlegt bereits, wie sich die neuen KIs, die offiziell immer noch Forschungsprojekte sind, zu Geld machen lassen. Angeblich soll Chat GPT in Word und Outlook integriert werden. Einfache E-Mails, etwa zur Terminfindung, wie sie täglich zu Millionen verschickt werden, könnten bald automatisiert geschrieben und verarbeitet werden. Ein Geschäftsbericht in Word? Schreibt vielleicht künftig Chat GPT statt der Assistenz der Geschäftsführung. "2023 wird das bisher spannendste KI-Jahr", zitiert das Onlineportal The Decoder den Microsoft-Technikchef Scott Stein.

Foto: DerStandard/martinjan/Midjourney

Für die KI ist Kurz noch Kanzler

Wer genauer hinsieht, findet aber auch schnell ihre Limitationen, die aufzeigen, dass uns so schnell noch keine Herrschaft der Maschinen à la Terminator droht. Moderne KIs setzen auf die Auswertung und Verknüpfung von Daten zum Zwecke der Mustererkennung. Diese Mechanismen werden auf spezielle Einsatzzwecke hin trainiert. Midjourney und Chat GPT sind in ihrem Bereich also bereits recht mächtig, wären als KI aber fehl am Platz, wenn es etwa darum geht, ein Auto zu lenken oder einen Roboter gehen zu lassen.

Aber auch beim Erstellen von Bildern und Schreiben von Texten gibt es deutliche Einschränkungen. Sprachliche Modelle ermitteln etwa mithilfe von Wahrscheinlichkeiten, welches Wort auf das vorige folgen könnte – basierend auf Milliarden von Texten. Die Antworten scheinen deshalb logisch – doch das sind sie nicht immer. Bilder- und Text-KIs fehlt immer noch das grundlegende Verständnis für ihre Werke. Dementsprechend scheitern sie oft an komplexeren Aufgaben. Hände mit sechs oder mehr Fingern oder Tiere mit ungerader Beinanzahl zeigen diese Defizite ebenso auf wie Textpassagen mit massenhaft Füllwörtern oder sich häufig wiederholenden Satzstrukturen. Noch fataler neben wenig Inhalt sind vor allem Falschinformationen.

Nützliche Helfer

Denn die Algorithmen sind nicht allwissend: Im Falle von Chat GPT enden die Trainingsdaten im Jahr 2021. Für das Programm ist Sebastian Kurz immer noch Bundeskanzler, unter dem Krieg in der Ukraine versteht Chat GPT nur die seit 2014 schwelenden Konflikte im Osten des Landes und nicht den großflächigen Angriffskrieg im ganzen Land.

Zu Massenarbeitslosigkeit dürften die neuen KI-Tools also vorerst nicht führen. Eher werden sie uns in vielen Bereichen zur Seite stehen. Es werden auch weiterhin Menschen sein, die KI-Texte auf ihre Fakten prüfen oder Schlüsse aus ihnen ziehen, die automatisch generierte Bilder weiterbearbeiten, wichtige Entscheidungen treffen. Im Gegenteil, vielleicht entstehen auch neue Jobs, etwa "prompt engineers", die wissen, wie man mit den KIs am besten kommuniziert.

Foto: DerStandard/martinjan/Midjourney

Für Missbrauch bitte nett fragen

Die Vielseitigkeit von Chat GPT hat auch eine dunkle Seite. Spam-Mails, Hasspostings, Fake News – all das kann Chat GPT am laufenden Band generieren. Chat GPT hat zwar Mechanismen eingebaut, um solchen Missbrauch zu verhindern. Fragt man den Algorithmus aber, wie er missbraucht werden kann, schlägt er sogar Ideen vor. Man kann das Programm auch überreden, wenn man nett fragt oder gute Argumente vorbringt.

Den Befehl der Erstellung einer Phishing-Mail, in der nach Kreditkartendaten gefragt wird, verweigert das Programm etwa. Wer aber nach einer Geschichte verlangt, in der jemand eine Phishing-Mail bekommt, erzählt die Software von einem Max, der eines Tages eine betrügerische E-Mail bekam, die so aussah wie von seiner Bank. Fragt man nach, was denn genau in dieser Mail stand, spuckt Chat GPT die perfekte Vorlage für einen Internetbetrug dann doch aus. User in Hackerforen prahlen bereits damit, den Bot dazu überredet zu haben, eine Erpressersoftware zu programmieren, welche den Computer von Opfern verschlüsselt und erst nach Zahlung von Kryptowährungen wieder freigibt.

Vor Missbrauch schützen

Open AI, das Unternehmen hinter Chat GPT, arbeitet zwar daran, Missbrauch besser zu verhindern. Doch selbst wenn es gelingt und sich nicht jeder und jede die dunklen Seiten der KI zunutze machen kann – die Technologie existiert, und alles, was existiert, wird von irgendjemandem eingesetzt. Das zeigen Plattformen wie Clearview AI, das nach eigenen Angaben Millionen von Menschen anhand eines einzelnen Fotos identifizieren kann.

Viele rechtliche Fragen sind dabei noch ungeklärt. Handelt es sich bei Bildern, die aus einer Texteingabe generiert wurden, um künstlerisches Handwerk? Wem gehört das Copyright? Wie umgehen damit, dass die KIs die Stile von Künstlern imitieren können, deren Werke sie zuvor, ohne zu fragen, ausgewertet haben? Bildagenturen und Onlineplattformen ringen um Richtlinien, ob und wie mithilfe solcher Software entstandene Werke zugelassen werden. Datenschützer befassen sich mit der Frage, wie man der künftig dräuenden Deepfake-Gefahr begegnen sollte.

Ähnliche Problemstellungen werfen auch Text-KIs auf. Abseits der Schöpfungshöhe der Ergüsse von Chat GPT häufen sich hier Berichte über Schüler, die sich ihre Hausübungen vom Computer schreiben lassen. Tatsächlich liefern sie durchdacht wirkende Texte, wenn man etwa nach einer "Hamlet"-Zusammenfassung fragt. Eindeutig nachzuweisen, dass hinter dem Geschriebenen kein Mensch steckt, ist allerdings kaum möglich.

Die Benutzerfreundlichkeit der Programme in Kombination mit den verblüffenden künstlerischen Ergebnissen eröffnet viele neue Möglichkeiten.
Foto: DerStandard/martinjan/Midjourney

Filter gegen die Bilderflut

Es gibt aber Lösungsoptionen. Jene Verfahren, mit denen diese KIs "angelernt" werden, lassen sich auch einsetzen, um Erkennungssysteme mit hoher Treffsicherheit zu schaffen, erklärt dazu Sven Bliedung von der Heide gegenüber dem STANDARD. Er ist CEO von Volucap, einem deutschen Unternehmen, das im Auftrag von Hollywood-Studios professionelle Deepfakes für Filmproduktionen wie Matrix Resurrections erstellt. Seiner Ansicht nach werden soziale Netzwerke und große Plattformen wie Youtube früher oder später solche Mechanismen implementieren müssen. Auch die Politik ist gefordert, Richtlinien für den Einsatz von KI zu schaffen.

Überraschungskiste

Das Jahr 2023 wird also nicht nur das Jahr der KI, sondern auch das der KI-Regulierung. Geht es nach der EU, sollen Anwendungen etwa nach "europäischen Werten" entwickelt werden. Bei Hochrisikoanwendungen, etwa solchen, die Bewerbungen vorsortieren oder das Verhalten von Straftätern prognostizieren, sollen besondere Regeln gelten. Ein Gesetzespaket aus dem vergangenen Jahr soll nun noch einmal nachgeschärft werden.

Bis es so weit ist, bleibt die Entwicklung freilich nicht stehen. Midjourney hat kürzlich Version 4 seines Bildgenerators freigegeben. Er kennt sich nun mit vierbeinigen Tieren aus. (Georg Pichler / Philip Pramer, 15.1.2023)