Das ist einer.

Foto: APA / Georg Hochmuth

Wien – Weg vom Hype, hin zur Anwendbarkeit: Künstliche Intelligenz (KI) ist heute nicht mehr auf Entwicklungslabore großer IT-Konzerne beschränkt. Das Feld geht in die Breite und erreicht zunehmend Klein- und Mittelbetriebe. Sie sind gut beraten, IT als integrativen Bestandteil des Unternehmens zu sehen, der Prozesse und Arbeitsweisen grundsätzlich verändert. KI wird dabei zum alltäglichen Werkzeug, so selbstverständlich wie Datenbankabfragen nach Schlagworten.

Doch so präsent die Technologie ist, so komplex und wenig nachvollziehbar wirkt sie auf viele Menschen. "Das Interesse an KI nimmt in Österreich stetig zu, jedoch fehlt vielen Firmen der Fahrplan zur konkreten Umsetzung oder aber das Vertrauen in die Technologie", sagt Ingo Nader, Senior Data Scientist beim IT-Dienstleister The unbelievable Machine Company in Wien. Der Experte gab bei der Applied Artificial Intelligence Conference (AAIC) der österreichischen Außenwirtschaft in Wien Einblicke in die konkrete Funktionsweise jener Methoden, die heute unter künstlicher Intelligenz zusammengefasst werden.

Begriffsklärung

Auf dem Weg zu etwas mehr Klarheit hilft eine kurze Begriffsklärung: Künstliche Intelligenz, Machine-Learning, Deep Learning und neuronale Netzwerke werden heute mehr oder weniger synonym verwendet. Dabei sind die Methoden des maschinellen Lernens eigentlich ein Teilgebiet der KI, in dem es darum geht, dass ein künstliches System anhand von Daten eine Fähigkeit lernen kann – etwa zur Unterscheidung gewisser Datenmuster.

Diese Fähigkeit kann dann in Bezug auf neue Daten, die nicht Teil des Trainings waren, verallgemeinert werden. Neuronale Netzwerke sind ein Typus von Algorithmen, mittels deren man maschinelles Lernen umsetzen kann. Mit dem Begriff Deep Learning werden besonders komplexe neuronale Netzwerke zusammengefasst.

Zuerst Linien, dann Rüssel

Nader erklärt die Struktur neuronaler Netzwerke anhand einer verbreiteten Anwendung, der automatischen Bilderkennung: "Die Neuronen, also Knotenpunkte eines neuronalen Netzwerkes, sind in vielen verschiedenen Schichten aneinandergereiht, in denen einfache mathematische Funktionen zur Anwendung kommen und Filter angewandt werden", so der Experte.

Das System soll zum Beispiel lernen, Elefanten auf Bildern zu erkennen. "Die ersten Schichten, die an das Bild anknüpfen, extrahieren beim Lernprozess sehr einfache Features: etwa gerade und schräge Linien", sagt der Experte. "Die nächste Schicht baut darauf auf und setzt die erkannten Features zu komplizierteren Strukturen zusammen, etwa Ecken. Je tiefer man vordringt, desto spezialisiertere Features werden gelernt." In einer letzten Schicht könnten dann so komplexe Features wie der Rüssel eines Elefanten erkannt werden. Bei der Anwendung dieser durch tausende Wiederholungen erlernten Methode wird der Elefant mit hoher Wahrscheinlichkeit richtig wiedererkannt.

Blackbox-Problem

Den neuronalen Netzwerken hängt nun der Ruf an, dass ihre Ergebnisse schwer nachvollziehbar sind. Diese sogenannte Blackbox macht etwa den Erbauern von autonomen Fahrzeugen Sorgen, die die Funktionsweise genau belegen können müssen. Für Nader gibt es aber durchaus Strategien, Licht ins kalkulatorische Dunkel zu bringen.

Sogenannte Heatmaps sind eine davon: "Bei diesen Visualisierungen sieht man sich eine Schicht des Netzwerks nahe am Auswertungsende genauer an", sagt der Entwickler. "Die Frage ist: Welche Kategorisierung liegt hier vor, und aus welchem Bereich des Bildes wurde sie abgeleitet?" In einem Beispiel mit Bildern eines afrikanischen Elefanten wurde das Tier laut Heatmap etwa an der Form der Ohren erkannt – nicht am Rüssel, wie man vermuten könnte.

Bauteile erkennen

In den Anwendungen derartiger Technologien in den Unternehmen geht es seltener um Elefantenohren. "Ein typisches Problem ist etwa die automatische Erkennung von Bauteilen. Es wäre auch denkbar, aus Abnutzungserscheinungen an Bauteilen die wahrscheinliche Lebensdauer abzuleiten", gibt Nader Beispiele.

"In einem besonders spannenden Projekt haben wir mittels eines Deep-Learning-Modells die verbleibende Lebensdauer von Kugellagern in Windturbinen bestimmt. Dabei waren die zugrunde liegenden Daten allerdings keine Bilder, sondern die Töne, die sie bei ihrer Bewegung von sich geben." (Alois Pumhösel, 17.11.2018)