Superspreader spielen nicht nur im Infektionsgeschehen der Corona-Pandemie eine große Rolle, auch in der digitalen Sphäre beeinflussen sie die Ausbreitung von Inhalten.

Foto: Getty Images / iStock / baranozdemir

Eine mathematische Formel, die Aufmerksamkeit in sozialen Medien garantiert, müsste wohl nicht allzu lange darauf warten, selbst rasend schnelle Verbreitung zu finden. Ein solches Universalrezept für virale Inhalte im digitalen Konkurrenzkampf gibt es zwar nicht. Warum manche Postings in Social-Media-Kanälen viel größere Verbreitung finden als andere, lässt sich aber durchaus wissenschaftlich ergründen.

Forschende analysieren das Phänomen mithilfe großangelegter Netzwerkmodelle, in denen Informationen mit bestimmten Wahrscheinlichkeiten über Verbindungen zwischen Knotenpunkten weitergegeben werden. Manche dieser Knoten sind "Superspreader" und verteilen besonders viele Inhalte, andere werden zu Informationssackgassen. Die Struktur dieser Prozesse ähnelt einem Vorgang, der in den vergangenen Jahren viel Aufmerksamkeit erhalten hat – dem Ausbreitungsmuster von Viren im Zuge einer Pandemie.

"Im Social-Media-Bereich möchte man eine möglichst große Ausbreitung der Inhalte erreichen und herausfinden, mit welchen Influencern man ein Produkt bewirbt. Bei einer Pandemie möchte man die Ansteckung hingegen möglichst blockieren", sagt Markus Sinnl vom Institut für Produktions- und Logistikmanagement der Universität Linz.

Simulierte Netzwerke

Mit dem Ausbruch der Corona-Pandemie Anfang 2020 erkannte der Wissenschafter, der sich seit Jahren mit mathematischen Theorien hinter den Ausbreitungsmustern von Social-Media-Inhalten beschäftigt, schnell die Parallelen zwischen den beiden so unterschiedlichen Phänomenen.

Seit 2021 vertieft Sinnl seine Forschung dazu im Projekt "Epidemieverhinderung in Netzwerken mit Integer Programming", das vom Wissenschaftsfonds FWF unterstützt wird. Schon seit den frühen 2000er-Jahren wird daran geforscht, wie sich Einfluss in Netzwerken fortpflanzt. Lösungsansätze für das sogenannte Influence-Maximization-Problem wurden zuerst mit den Mitteln der Computerwissenschaften entwickelt.

"Man entwarf ein Set an Annahmen, das das Netzwerk und die Beeinflussungswahrscheinlichkeit bestimmte, und entwickelte einen Algorithmus, der die Informationsausbreitung auf Basis dieser Rahmenbedingungen durchspielte", erklärt Sinnl.

"Mit dieser Herangehensweise können sehr große Netzwerke simuliert werden. Gleichzeitig kann man aber niemals beweisen, dass man eine optimale Lösung für die Maximierung des Einflusses in einem Netzwerk gefunden hat."

Ganzzahlige Programmierung

Sinnl entschied sich für einen anderen Zugang, der durch die gestiegenen Rechenkapazitäten moderner Computer erst seit wenigen Jahren auf größere Netzwerke angewandt werden kann.

"Mein Feld ist jenes der ganzzahligen Programmierung, mit dem bereits viele praktische Probleme – etwa das Erstellen von Fahrplänen für öffentliche Verkehrsmittel – lösbar sind", erklärt der Forscher. "Damit kann man auch die Informationsausbreitung in einem Netzwerk mit rein mathematischen Mitteln abbilden. Man formuliert die Problemstellung als System von Gleichungen, die letztendlich zu einem beweisbar optimalen Ergebnis führen."

Die Herausforderung besteht hier vor allem in einer kreativen mathematischen Aufgabe: Man muss möglichst einfache, von Computern relativ schnell lösbare Formeln finden, die gleichzeitig aber eine größtmögliche Komplexität abbilden.

Dieselben Prinzipien lassen sich laut Sinnl nahezu eins zu eins auf die Berechnung der Virenausbreitung übertragen – was bisher aber noch kaum systematisch verfolgt wurde. "Der menschliche Kontakt, bei dem die Krankheit übertragen wird, lässt sich als Verbindung zwischen Knotenpunkten in einem Netzwerk betrachten. Jede Verbindung trägt eine gewisse Wahrscheinlichkeit für eine Ansteckung in sich. Das Virus wird zu einem Akteur, der eine maximale Ausbreitung erreichen will", sagt Sinnl.

Komplexe Annäherung

Eine Fragestellung im Projekt ist, inwiefern man mit der rein mathematischen Darstellung eines Netzwerks tatsächlich die Pandemieprobleme der realen Welt abbilden kann. Die Methode ist zwar exakt, aber die Netzwerkgröße einer konventionellen algorithmischen Simulation ist mit den gegenwärtigen Rechenkapazitäten etwa noch nicht erreichbar.

"Wir können derzeit Netzwerke mit bis zu 70.000 Knotenpunkten abbilden. Von den Netzwerken der realen Welt mit ihren Millionen Teilnehmern sind wir noch weit entfernt. Dennoch gibt es Aufgaben, für die sich der Ansatz gut eignen könnte", erklärt Sinnl. "Beispielsweise können wir wichtige Teilbereiche der konventionellen algorithmischen Modelle ‚nachrechnen‘ und verifizieren, sodass diese Systeme insgesamt genauer gemacht werden können." (Alois Pumhösel, 16.4.2022)