Als Apple im Jahr 2011 erstmals Siri der Weltöffentlichkeit präsentierte, war die Begeisterung groß. Ein digitaler Assistent, dem man einfach via Sprachbefehl Fragen stellen oder Befehle geben konnte, das mutete so manchen Beobachtern geradezu magisch an. Ein Blick in eine unaufhaltbare Zukunft, ein Stück Realität gewordene Science-Fiction. Konkurrenten wie Amazon und Google folgten bald mit eigenen Alternativen, und auch Hollywood ließ sich inspirieren: Beim Film "Her" stand unübersehbar eine Art weiterentwickelte "Siri" im Zentrum der Handlung – wenn auch bereits mit ersten kritischen Tönen versehen.

Vision trifft Realität

Ein Jahrzehnt später ist die anfängliche Begeisterung längst verflogen, ersetzt wurde sie durch ein ganz anderes Gefühl: Ernüchterung. Ernüchterung darüber, dass auch im Jahr 2023 die Realität von Siri, Alexa und Google Assistant so gar nichts mit den großen Visionen früherer Jahre zu tun hat.

Denn auch wenn die dahinterstehende Software über die Jahre konsequent weiterentwickelt, die Spracherkennung besser, die Funktionalität größer wurde, ihr Einsatz ist weiter extrem beschränkt. Es sind nicht große philosophische Diskussionen, die mit solchen Systemen geführt werden. Seit Jahren dominieren zwei sehr simple Anwendungen in allen Statistiken zu solchen Assistenten. Die Abfrage des aktuellen Wetters sowie das Abspielen von Musik.

Kaum relevante Fortschritte

Das mag auch an einem anderen Umstand liegen, den die Hersteller natürlich nicht gar so gerne hören: In Wirklichkeit gab es in den vergangenen Jahren wenig substanzielle Verbesserung bei all diesen Systemen. Für die breite Masse an Nutzern ist der Alltag mit Alexa, Siri und Co praktisch der gleiche wie vor fünf Jahren – und zwar oftmals gleich frustrierend.

Bei den ersten Hardwargenerationen von Amazon Echo und Google Home waren die Erwartungen noch hoch. Seitdem hat sich in Wirklichkeit aber nur wenig Substanzielles getan.
Foto: Mark Lennihan / AP

Es gibt noch immer zu viele Fehlerkennungen, weiterhin muss man sehr genau darüber nachdenken, wie eine Anfrage formuliert wird, damit die eigenen Wünsche auch erfüllt werden. Oft ist es da einfacher – und schneller –, das Smartphone zur Hand zu nehmen, um die gewünschte Aufgabe zu erledigen. Das gilt selbst für Smart-Home-Aufgaben, also einen Einsatzbereich, bei dem die digitalen Assistenten eigentlich eine zentrale Rolle einnehmen sollen.

Gewöhnung: nicht eingetreten

Dazu kommt, dass auch die soziale Akzeptanz von Sprachsteuerung weiter überschaubar ist. Nun sind solche sozialen Normen natürlich immer Verhandlungssache und verschieben sich regelmäßig. So gab es vor Jahren noch gehörig Spott für die ersten Earbuds, in früheren Jahren war die Aufregung über (damals) junge Menschen mit Walkman und Kopfhörern im Straßenbild ebenfalls nicht gerade gering, bis das irgendwann einfach ganz normal war. Bei Sprachsteuerung ist diese Verschiebung bisher aber nicht eingetreten – was umgekehrt erst recht wieder ein Beleg für den überschaubaren "Erfolg" solcher Systeme ist.

Privacy-Kontroversen

Sicher nicht hilfreich waren auch all die Kontroversen zum Thema Privatsphäre, die rund um solche Assistenten ausgetragen wurden. Um die Qualität der Spracherkennung zu verbessern, sammelten die Hersteller eifrig Aufnahmen, die dann zum Teil auch von Menschen angehört und überprüft wurden. Mittlerweile ist all das zwar optional, auch wird ein wachsender Teil der Aufgaben mittlerweile rein lokal abgewickelt. Der schlechte Ruf blieb aber.

Gleichzeitig muss allerdings auch gesagt werden: Wer all die Privacy-Diskussionen der vergangenen Jahre näher verfolgt hat, der wird auch – ernüchtert – feststellen müssen: Wären diese Systeme gut genug, wäre das Thema Privatsphäre kein großes Hindernis für den Erfolg. Für die meisten Nutzer steht die Funktionalität noch immer über dem Schutz der eigenen Daten.

Rückgang der Nutzung

Die Stagnation beim Thema digitale Assistenten lässt sich übrigens auch in Zahlen fassen. Wie aus einer vor einigen Monaten veröffentlichten Untersuchung von Voicebot hervorgeht, ist zumindest in den USA die Nutzung von Sprachassistenten auf Smartphones zwischen 2020 und 2021 sogar zurückgegangen. Eine fast schon vernichtende Statistik, zieht man all die – auch finanziellen – Bemühungen von Google, Amazon und Konsorten in Betracht.

Was für die Hersteller aber fast noch schlimmer ist: Bisher hat niemand eine irgendwie taugliche Form der Monetarisierung für digitale Assistenten gefunden. Das liegt einerseits natürlich daran, dass die real genutzten Einsatzszenarien dermaßen simpel sind. Würde etwa an eine Wetteransage auch noch Werbung angefügt, wären wohl bald die letzten Nutzer verjagt. Vor allem aber haben sich keine anderen Ansätze gefunden, um Geld mit solchen Assistenten zu machen.

Shopping? Nein, danke!

Besonders bitter ist das für Amazon, wo man sich lange der Hoffnung hingab, dass die Echo-Lautsprecher ein Vehikel zur Steigerung der Umsätze auf der eigenen Handelsplattform werden – und die Hardware selbst entsprechend von Anfang an geradezu verschleudert wird. Nicht ganz überraschend hat sich herausgestellt, dass kaum jemand via Sprachbefehl shoppen will – sondern lieber am Bildschirm die volle Kontrolle hat.

Vernichtende Bilanz

Das Ergebnis sind wahre Horrorzahlen: Wie vor einigen Wochen öffentlich wurde, dürfte die Alexa-Abteilung bei Amazon allein im Jahr 2022 rund zehn Milliarden US-Dollar Verlust gemacht haben. In einem finanziell schwieriger werdenden Umfeld, darf es also nicht wundern, dass da schnell existenzielle Fragen laut wurden – auch wenn Amazon diese bisher zumindest halbherzig dementiert.

Besonders ernüchternd sind die Zahlen von Amazon, die zuletzt durchgesickert sind.
Foto: Proschofsky / STANDARD

Selbst Google schaltet zurück

Bei Apple und Google sieht die Lage zwar weniger dramatisch aus, einfach weil man die für digitale Assistenten verwendete Technologie ohnehin für andere Bereiche benötigt – allen voran Spracheingabe für andere Geräte wie Smartphones oder künftig wohl auch AR-Brillen. Doch auch hier ist eine deutliche Abkühlung zu dem Thema unübersehbar.

Bei Apple fährt Siri ohnehin schon länger auf Sparflamme, und auch Google soll zuletzt die Assistant-Abteilung deutlich zusammengekürzt haben. Statt mit begrenztem Erfolg auf Partnerschaften zu setzen, will man bei dem Android-Hersteller die Ressourcen lieber in die Optimierung einzelner Funktionen für eigene Smartphones und andere Geräte stecken.

Ein Milliardengrab

Nüchtern betrachtet muss man also gerade angesichts der einst hochgesteckten Erwartungen festhalten: Digitale Assistenten sind gescheitert – und ein Milliardengrab für all jene Firmen, die sich einen solchen leisten. Wäre da nicht eine aktuelle Entwicklung, die die Hoffnungen vieler neu aufflammen lässt – oder die Karotte noch ein bisschen länger vor die Nase hält, je nach Perspektive.

Neuer Schwung?

Genau genommen könnte man nämlich auch ChatGPT als digitalen Assistenten verstehen – oder zumindest als wichtigen Baustein für die Schaffung eines solchen. Kann die Text-KI von OpenAI, die in den vergangenen Wochen für einiges Aufsehen gesorgt hat, doch jetzt schon vieles, was einst von solchen Systemen erhofft, aber nie eingelöst wurde.

ChatGPT kann ebenso zwanglos mit den Usern über beliebige Themen plaudern wie bei der Lösung konkreter Aufgaben – oder auch nur beim Brainstorming – behilflich sein. All das so überzeugend, dass viele, die die Text-KI zum ersten Mal benutzen, wohl einen ähnlich "magischen Moment" erleben, wie es einst bei der ersten Siri-Version der Fall war.

Eine Portion Realismus auch hier

Freilich sollte schon allein diese Analogie zeigen, dass man auch hier wieder vorsichtig mit den Erwartungen sein sollte – vor allem auch was den Zeitrahmen anbelangt. Auf breiter Basis wird das alles nicht so schnell kommen, wie manche Beobachter im Überschwang der technischen Begeisterung derzeit prognostizieren.

Das liegt zunächst einmal an dem massiven Rechenaufwand, den ein solch riesiges Maschinenlernmodell, wie es hinter ChatGPT steht, nun einmal benötigt. Aktuelle Schätzungen gehen davon aus, dass der Betrieb von ChatGPT selbst im derzeit noch überschaubaren Betatest den Betreibern jedes Monat mehrere Millionen US-Dollar an Serverkosten verursacht. Insofern ist das Ganze derzeit vor allem eines: ein sehr kostspieliges Techdemo – wenn auch fraglos ein äußerst beeindruckendes.

Viele Hürden

Bis sich solche Systeme auch wirklich rechnen, müssten sie noch um ein Vielfaches effizienter laufen. Und selbst dann würde all das wieder auf den Cloud-Servern irgendwelcher großen Unternehmen stattfinden, womit sich erst recht wieder allerlei Fragen zur Privatsphäre stellen. Davon, dass so etwas einmal lokal auf einem Smartphone läuft (wie es mittlerweile bei Spracherkennung geht), ist die technische Entwicklung derzeit noch Jahre entfernt.

Dazu kommt noch eine Fülle von anderen Problemen, die es auszuräumen gilt. Das wichtigste davon: Systeme wie ChatGPT sind zwar äußerst überzeugend – aber auch oft überzeugend falsch. Das mag für ein zwangloses Gespräch im Kreise der virtuellen Familie nett sein, als Wissensquelle wird das Ganze damit aber ziemlich problematisch. Auch eine Fülle von ethischen und rechtlichen Fragen zu solchen KIs ist bisher ungeklärt.

Aus gutem Grund vorsichtig

All das ist übrigens auch der Grund, warum andere Unternehmen wie Google in dieser Hinsicht bisher eher zurückhaltend agieren. Zwar arbeitet man dort seit Jahren an sehr ähnlichen, großen KI-Systemen, üblicherweise beschränkt man sich dabei aber auf kurze Präsentationen ihrer Fähigkeiten im Rahmen irgendwelcher Konferenzen.

Dass man öffentliche Produkte mit solch recht allgemeinen Maschinenlernmodellen scheut, hat nicht zuletzt damit zu tun, dass sich hier ein Branchenriese vor einigen Jahren ganz gehörig die Finger verbrannt hat. Microsoft war es, das 2016 stolz einen Chatbot namens Tay präsentierte, der sich innerhalb von nicht einmal 24 Stunden in ein "rassistisches Arschloch" verwandelte, wie es "The Verge" damals ohne Hang zum Euphemismus beschrieb.

Neuer Druck

Trotzdem: Die Vorstellung von ChatGPT erhöht nun natürlich den Druck auf andere Unternehmen. Zu groß ist die Gefahr, hier einen Trend zu verpassen, zu spät auf den Zug aufzuspringen. Also werden sicher auch Google, Amazon und vielleicht sogar Apple bald das Risiko eingehen und Ähnliches in irgendeiner Form vorstellen – und dafür viel Geld verbrennen.

Ob man es dann in den kommenden Jahren schafft, solch eine Software wirklich zu monetarisieren und parallel dazu all die anstehenden Defizite auszuräumen, oder ob das Fazit in einem Jahrzehnt dann erst recht wieder ähnlich aussieht, ist natürlich noch einmal eine ganz andere Frage. (Andreas Proschofsky, 6.1.2023)