Sarkasmus, also das Stilmittel des Spottens durch "beißende" und oft nicht wörtlich gemeinte Bemerkungen, gehört zum grundlegenden Repertoire der Kommunikation im Netz. Doch nicht immer ist es einfach, sarkastische Äußerungen und Ernstgemeintes zu unterscheiden. Das gilt besonders für schriftliche Kommunikation, in der Hinweisgeber wie Gestik, Mimik oder Tonlage fehlen. Und da, wo sich Menschen mitunter schwer tun, scheitern künstliche Intelligenzen besonders häufig. Die kontextuelle Interpretation von Sprache gehört zu den größten Herausforderungen für solche Systeme.

Einen wesentlichen Fortschritt melden nun Wissenschafter der University of Central Florida (UCF). Sie haben eine Art "Sarkasmus-Detektor" entwickelt, vermeldet "Neuroscience News".

Schlüsselbegriffe und Abhängigkeiten

"Lasst uns einfach die Rassentrennung wieder einführen, das wird sicher super funktionieren!", lautet einer der Beispielsätze, die analysiert wurden. Sofern dieser Satz nicht in einem Gespräch unter eingefleischten Rassisten fällt, ist es sehr offensichtlich, dass genau das Gegenteil von dem gemeint ist, was wörtlich abgebildet wird. Übliche Textanalysesysteme erkennen dies in der Regel aber nicht.

Die mehrstufige Verarbeitung eines Satzes.
Foto: UCF

Die KI der UCF hat aus Social-Media-Konversationen gelernt und fährt zweigleisig, um dem Sarkasmus auf die Schliche zu kommen. Das erste "Modul" versucht Schlüsselwörter zu identifizieren, die auf möglicherweise nicht wörtlich gemeinte Aussagen hinweisen. In diesem Falle wären das etwa aus dem englischen Originalsatz "Just start segregation again, it will totally work!" die Begriffe "just", "segregation", "totally" sowie das Rufzeichen.

Recht hohe Genauigkeit

Das zweite "Modul" hat gelernt, Abhängigkeiten zwischen diesen Begriffen zu erkennen. Beide kommen in einem mehrstufigen Prozess zum Einsatz, an dessen Ende ein Wahrscheinlichkeitswert zwischen 0,01 und 1 errechnet wird. Je näher am oberen Ende der Skala das Ergebnis liegt, desto größer ist der Sarkasmusverdacht.

In Testläufen mit Datensätzen von Twitter und Reddit sowie einer für diesen Testzweck zusammengestellten Sammlung (Sarcasm Corpus V2 Dialogues) konnte man bisherige Systeme, die sich an Sarkasmuserkennung versuchten, übertrumpfen. Die Genauigkeit schwankte zwischen 77,4 und 97,9 Prozent.

Foto: UCF

Mit manchen Fällen hat das System aber noch erhebliche Probleme. Insbesondere bei Fragestellungen tut sich die KI noch sehr schwer bei der Einstufung, ob diese wörtlich oder rhetorisch gemeint sind. (gpi, 11.5.2021)