Daten seien das Gold des digitalen Zeitalters, ist oft zu lesen. Sie gelten als entscheidender Wettbewerbsvorteil der ökonomisch unter Druck stehenden Industrienationen, die hinsichtlich Arbeits- und Produktionskosten nicht mit weniger entwickelten, aber aufstrebenden Regionen mithalten können. Welche Metapher für die sogenannte Währung moderner Wissensgesellschaften man auch immer bevorzugt: Um Daten zu verstehen und aus ihnen einen Nutzen ziehen zu können, muss man erst lernen, sie richtig aufzubereiten.

"Datenvisualisierungen transformieren die dahinterstehenden Daten in etwas, das wir Menschen anschauen können", erklärt Wolfgang Aigner, wissenschaftlicher Leiter des Instituts für Creative Media Technologies an der Fachhochschule St. Pölten. "Es sind visuelle Repräsentationen, die wie eine Sprache über Syntax, Grammatik und Semantik verfügen. Um verstehen zu können, was in den Daten drin ist, muss man verstehen, diese Visualisierungen zu lesen und zu interpretieren."

Das Zeitalter der digitalen Daten ist längst angebrochen. Um aus der enormen Informationsmenge auch nützliches Wissen gewinnen zu können, kommt es auf die entsprechende Aufbereitung der Daten an.
Foto: Getty Images / iStockphoto

Intuitives Verständnis

In dem Projekt Seva (Self-Explanatory Visual Analytics for Data-Driven Insight Discovery) nimmt sich Aigner genau dieser Aufgabe an. Ziel ist es, dabei zu helfen, das intuitive Verständnis von Datenvisualisierungen zu verbessern. Das dreijährige Projekt wird von der Österreichischen Forschungsförderungsgesellschaft (FFG) im Rahmen der Programmschiene "IKT der Zukunft" gefördert. Projektpartner sind die FH Joanneum, die TU Wien sowie die Unternehmen Datavisyn und Landsiedl Popper.

Als Ansatzpunkt fungiert bestehende Visualisierungs- und Analysesoftware, die in der biomedizinischen Forschung sowie im Datenjournalismus eingesetzt wird. Für diese entwickeln die Wissenschafterinnen und Wissenschafter sogenannte Onboarding-Methoden, also Verfahren und Techniken, die Nutzer von visuellen Analysesystemen während der Arbeit beim Verständnis der Visualisierungen unterstützen sollen.

Es handelt sich dabei allerdings nicht um plötzlich aufpoppende Helferlein, wie man sie beispielsweise von populären Office-Programmen kennt. Vielmehr können die Anwender selbst entscheiden, wann sie Unterstützung brauchen. "Es ist kein reines Lernwerkzeug, sondern auch als Hilfe während der Anwendung konzipiert – auch wenn man dessen Unterstützung im Lauf der Zeit immer weniger benötigen wird", sagt Aigner.

Teilweise handelt es sich um textliche Erklärungen einzelner Komponenten von Visualisierungen, etwa eines Balkens, eines Kreissegments oder einer Verbindungslinie zwischen Netzwerkelementen. Teilweise werden auch inhaltliche Zusammenhänge zwischen Daten in Aussageform zusammengefasst.

Komplexe Visualisierungen

Eine Besonderheit der neuen Methoden ist, dass allgemeine Beschreibungstexte automatisiert generiert werden. Detailliertere Hinweise, die teilweise in fachspezifischer Terminologie an den jeweils zugrunde liegenden Datensatz angepasst sind, können die Hersteller von Visualisierungstools selbst manuell hinzufügen. Dafür werden die Projektpartner die nötigen Softwarebibliotheken zur Verfügung stellen. Prototypische Beispiele der diversen Onboard-Methoden lassen sich im Internet unter onboarding-methods.netlify.app kostenfrei ansehen.

Am Beginn des Projekts standen empirische Erhebungen. Dabei wurden das vorhandene Wissen und der Visualisierungsbedarf von Daten bei verschiedenen Nutzergruppen erhoben. In weiterer Folge wurde auch geprüft, inwiefern konkrete Visualisierungstechniken bereits im akademischen und im Forschungsalltag verbreitet sind.

"Wie letztlich zu erwarten war, sind klassische Visualisierungen wie Balkendiagramme oder Tortendiagramme bei Anwenderinnen und Anwendern weitgehend bekannt", erklärt Projektleiter Aigner. "Bei Mengendiagrammen, Netzwerkdiagrammen oder Parallelkoordinatendiagrammen ist das Wissen weit weniger stark ausgeprägt."

Ein weiteres Resultat, das durch das Forschungsprojekt zutage gefördert wurde: Anwenderinnen und Anwender aus der biomedizinischen Forschung wünschen sich für ein tiefes Verständnis der Visualisierungen Informationen darüber, wie die Rohdaten transformiert wurden. In Experimenten zeigte sich außerdem, dass für die Aufbereitung von Lerninhalten generell die sogenannte Scrollytelling-Methode bevorzugt wird. Das ist eine aus dem Online-Journalismus bekannte Darstellungsform, bei der man sich mittels Scrolling linear durch eine Seite bewegen kann. (Raimund Lang, 8.10.2022)