Im weiter wachsenden Berg wissenschaftlicher Fachliteratur findet sich immer mehr maschinell erzeugter Müll.
IMAGO/YAY Images

Pro Jahr erscheinen mittlerweile weit mehr als zwei Millionen wissenschaftliche Publikationen, Tendenz weiter steigend. In dieser kaum mehr überschaubaren Flut an Arbeiten dürfte sich allerdings immer häufiger mehr oder weniger gefährlicher, in jedem Fall wertloser Müll befinden: Fake-Publikationen, die mittels künstlicher Intelligenz aus Versatzstücken anderer Fachpublikationen zusammengekleistert werden und es dennoch schaffen, in wissenschaftlichen Fachjournalen zu erscheinen.

Zu diesem Schluss kam im Herbst 2023 ein Bericht im Fachmagazin "Nature", der wiederum auf Analysen der Londoner Firma Clear Skies beruhte. Ihr Chef Adam Day entwickelte zum Aufspüren der durch KI generierten Artikel seinerseits eine KI, die verdächtige von unverdächtigen Artikeln unterscheidet. Mit dieser Software überprüfte er knapp 50 Millionen wissenschaftliche Arbeiten, die seit dem Jahr 2000 erschienen waren – auf ausdrücklichen Wunsch und mit Unterstützung einschlägiger Fachmagazine.

Heldin des Aufspürens von Fälschungen

Die Resultate waren einigermaßen ernüchternd und bestätigten pionierhafte Recherchen etwa der Mikrobiologin Elisabeth Bik, die sich seit langem heldenhaft mit dem Aufdecken von Manipulationen von wissenschaftlichen Abbildungen befasst und zuletzt wieder einige prominente Forschende der Manipulation überführte.

This Scientist catches FRAUD in Harvard and Stanford Research
Pete Judo

Gerade auch beim Aufspüren von gefälschten wissenschaftlichen Abbildungen wird KI-Fake mittels KI bekämpft: Eine neue Software namens Imagetwin kann Bilder in neuen wissenschaftlichen Artikeln mit 51 Millionen bereits publizierten Abbildungen der letzten 20 Jahre vergleichen, berichtete kürzlich das "Wall Street Journal".

Wissenschaftliche Betrugsindustrie

Laut den Schätzungen von Adam Day und seinem Team wurden in vergangenen gut zwei Jahrzehnten mehr als 400.000 Forschungsartikel veröffentlicht, die starke inhaltliche Ähnlichkeiten mit Fake-Artikeln haben, die nachgewiesenermaßen von sogenannten Paper-Mills (also "Papiermühlen" oder "Papierfabriken") erzeugt worden waren.

Darunter versteht man Unternehmen, die maßgeblicher Teil jener akademischen und wissenschaftlichen Betrugsindustrie sind, die sich in den letzten Jahren herausgebildet hat. Das Hauptgeschäftsmodell solcher Paper-Mills, deren Dienste insbesondere in Ländern wie Saudi-Arabien, Pakistan, Russland oder China nachgefragt werden, besteht darin, Autorenschaften von solchen Fake-Artikeln für Geld zu verkaufen.

Die Nachfrage scheint groß, und die Zahl der mutmaßlichen Fake-Artikel dürfte laut den Untersuchungen seit dem Jahr 2000 stark angestiegen sein: So wurden laut den Analysen von Clear Skies und "Nature" allein 2022, im aktuellsten untersuchten Jahr, 70.000 der mutmaßlichen Fake-Artikel aus Paper-Mills veröffentlicht. Besonders dramatisch dürfte die Situation in der Biologie und der Medizin sein, wo eine weitere, als Preprint publizierte Studie des deutschen Neuropsychologen Bernhard Sabel mit einer anderen Methode zuletzt nicht weniger als elf Prozent Verdachtsfälle fand. Vor allem verdächtig: Publikationen aus Russland, der Türkei, China, Ägypten und Indien, die bis zu 55 Prozent der möglichen Fake-Artikel ausmachen. (tasch, 19.3.2024)