Stanford-Experte: "Wir sind fantastische Datengeneratoren"

Princeton, Harvard, Berkeley, Stanford: David Donoho hat in seiner Laufbahn kaum eine US-Topuni ausgelassen. Als Statistiker spannte er den Bogen von mathematischer Grundlagenforschung zu ganz praktischen – und zum Teil bahnbrechenden – Anwendungen in der digitalen Signal- und Bildverarbeitung, etwa bei der Analyse von Aufnahmen aus der Magnetresonanztomografie (MRT). 2013 wurde der Pionier auf dem Gebiet der Datenwissenschaften (Data-Science) mit dem mit 1,2 Millionen US-Dollar dotierten Shaw Prize für Mathematik ausgezeichnet.

STANDARD: Statistik war gestern, heute spricht jeder von Data-Science – ist das nur ein Modewort, oder steckt mehr dahinter?

Donoho: Data-Science ist eine neue Nomenklatur für ein Feld, das sich seit den 1950er-Jahren geformt hat. Aber erst in den letzten zehn Jahren ist dieses Feld so richtig in Fahrt gekommen, einfach weil es unleugbar wichtig geworden ist. Die Smartphone-Revolution gab nahezu jedem auf der Erde ein Gerät in die Hand, das uns in fantastische Datengeneratoren verwandelt. Das alles passiert stillschweigend, man ist sich dessen kaum bewusst. Doch um all diese Daten zu generieren, braucht es ein gewaltiges Telekommunikations- und Cloudcomputingsystem. Dahinter steht ein zivilisatorisches Projekt, das einen Aufstieg von Kommunikationsmöglichkeiten hervorbrachte, der vor 15 Jahren nicht vorherzusehen war.

Keine leichte Übung: "Es geht nicht mehr um Computer, sondern um die Auswirkung all dieser Daten auf die Zivilisation", sagt David Donoho.

STANDARD: Wie wirkt sich das aus?

Donoho: Das zivilisatorische Projekt manifestiert sich in massiven Verhaltensänderungen. In Afrika hat sich das Leben dadurch enorm verändert. Die Leute verwenden kein Geld, sondern Handyminuten als Währung – und sind so nicht mehr auf korrupte Regierungen oder Konzerne angewiesen. Es geht nicht nur um Ermächtigung und leichteren Zugang zu Informationen, sondern auch um politische Transformationen.

STANDARD: Was bedeutet das für die Datenwissenschaft?

Donoho: Ein Teil der größeren Bedeutung der Smartphone-Revolution ist, dass die Menschheit eine Billion Handyfotos im Jahr hochlädt. Mithilfe dieser Daten haben wir drastische Fortschritte beim Interpretieren und Verarbeiten von Bildern gemacht. Weil Teenager auf einmal Massen an Selfies und Großeltern Babyfotos teilten, ist eine immens große Bilddatenbank entstanden, wie sie nie zuvor existiert hat.

STANDARD: Aufgrund dieser privaten Fotos konnten sich also automatische Bildanalyse und maschinelles Lernen entwickeln?

Donoho: Genau. Von Billionen Fotos, die hochgeladen werden, sind Milliarden öffentlich zugänglich. Das Projekt Imagenet sammelt diese gefundenen Daten aus dem Internet. 2012 gelang bei der Imagenet-Challenge, einem Wettbewerb, in dem Softwareprogramme möglichst korrekt Objekte in Bildern erkennen sollen, ein Durchbruch durch neuronale Netze. Das gleiche Modell war immer wieder erfolgreich, um Klassifikations- und Erkennungsmerkmale zu entwickeln, egal ob für Bilder, Stimmen, Fingerabdrücke oder Iriserkennung.

STANDARD: Von der Datenanalyse profitiert nicht nur die Wissenschaft, sondern ganze Wirtschaftszweige.

Donoho: Die Wirtschaft kann Bedeutung aus den Daten destillieren und Resultate produzieren, die von Interesse für Unternehmen sind. So wurde Data-Science zu einer Jobbeschreibung. Erst danach hat sich Data-Science allmählich auf akademischem Level etabliert. Auch wenn es noch offen ist, was die Disziplin letztlich ausmachen wird, nach welchen Kriterien sie eingegrenzt wird.

STANDARD: Die technologische und die wissenschaftliche Transformation bringen auch viele Ängste mit sich – Stichwort künstliche Intelligenz oder Datenmissbrauch. Wie geht die Data-Science damit um?

Donoho: Diese Ängste sind ein weiterer Grund, warum wir Data-Science als Disziplin brauchen. Es geht darum, welche Rolle Daten im Leben von Menschen spielen. Das geht weit über die Technologie hinaus. Wir haben Daten darüber, wer mit wem befreundet ist, wer mit wem spricht, wie sich die Leute den Tag über bewegen. Diese Dinge werden die ganze Zeit gemessen. Es geht nicht um den Missbrauch der Privatsphäre oder Überwachung – Forscher können durch die Analyse anonymisierter Daten bessere Transportsysteme und medizinische Versorgung planen. Wenn man die neuen Ressourcen kombiniert mit menschlichen Bedürfnissen, wird man Dinge entwickeln können, die wir uns noch gar nicht vorstellen können.

STANDARD: Ist die Vorstellung, dass alles durchschaubar und vorhersehbar wird, nicht auch ein wenig beängstigend?

Donoho: Für mich sind Vorhersagen nichts Unbehagliches. Für mich heißt das, den Leuten ehrlich zu sagen, welche Tendenzen es gibt, Dinge aufzuzeigen, die sie sonst nicht sehen würden. Wenn ein Computer mein Verhalten vorhersagt, wenn ich zum Beispiel mein Haus betrete, empfinde ich das am Anfang vielleicht als zudringlich. Wenn sich herausstellt, dass das System meine Gewohnheiten kennt wie eine Jeannie, die meine Wünsche abliest, wäre ich wahrscheinlich zufrieden. Es braucht aber einen Code für die ethische Nutzung von Informationen. Es geht jedenfalls bei Data-Science nicht mehr um Computer und darum, wie sie Prozesse optimieren, sondern um den Menschen, um die Auswirkung all dieser Daten auf die menschliche Zivilisation, um die Dinge, die das Leben in diesem Jahrhundert prägen werden. (Karin Krichmayr, 29.7.2018)

David Donoho, geb. 1957, ist Professor für Statistik an der Stanford University, wo er auch Anne T. and Robert M. Bass Professor in the School of Humanities and Sciences ist. Er war kürzlich zum Auftakt der Vortragsserie "What Is Data Science" an der Fakultät für Informatik der Uni Wien zu Gast.

Link
David Donohos "50 Years of Data Science" im Journal of Computational and Graphical Statistics

Wissen: Tausendsassa Data Scientist

Statistik, Mathematik, Computerwissenschaften, maschinelles Lernen, Datenmanagement und -visualisierung, am besten noch Wirtschaft und Recht: Der prototypische Data-Scientist ist ein Tausendsassa, der möglichst auf all diesen Gebieten sattelfest ist, um die Datenflut in nutzbares Wissen zu verwandeln. "The sexiest job of the 21st century", befand die Harvard Business Review.

Seit einiger Zeit sprießen Data-Science-Programme auch an heimischen Unis. Die Uni Salzburg startete im Wintersemester 2016 ein komplettes viersemestriges Masterstudium Data-Science. Seit Herbst 2017 bietet die Uni Linz eine Spezialisierung innerhalb der Masterstudien Computer-Science, Statistik und Wirtschaftsinformatik. Diesen Herbst zieht die TU Wien mit einem Masterstudium nach. Weiters bieten u. a. die WU Wien, die FHs Wiener Neustadt, St. Pölten, Oberösterreich, die FH IMC Krems und die Uni Wien einschlägige Ausbildungen an. An der Uni Wien wurde kürzlich die neue interdisziplinäre Forschungsplattform "Data Science@Uni Vienna" gegründet. (kri)

Smartphone-Revolution

Stanford-Experte: "Wir sind fantastische Datengeneratoren"

Forum:

Ihre Meinung zählt.