In "Montezuma's Revenge" stellte die KI einen neuen Rekord auf.

Foto: Steam

Künstliche Intelligenz (KI) scheitert oftmals, wenn sie sich in unbekannte Gefilde begeben muss. Entwickler beim Fahrdienstleister Uber und dem KI-Institut Open AI haben jetzt einen entscheidenden Fortschritt zu vermelden. Die Programmierer gaben der KI eine Form von Gedächtnis, die zu einem Weltrekord im Videospiel Montezuma's Revenge führte, berichtet das Onlinemagazin "1E9".

Unschlagbar in Schach

In traditionellen Denkspielen wie Schach und Go können Menschen mittlerweile mit dem Computer nicht mehr mithalten. Auch in E-Sport-Disziplinen sind die Athleten in Dota 2 und Starcraft 2 der künstlichen Intelligenz immer wieder unterlegen. Einzig in komplexen Umgebungen ist die KI noch im Nachteil im Vergleich zu Menschen. Das bedeutet, wenn das Umfeld aus mehreren Ebenen und Abschnitten besteht, in denen eine Vielzahl von Aufgaben erfüllt werden muss, scheint die KI noch zu stottern. Aber auch das hat sich geändert.

NoobFromUA

Die Forscher haben einer künstlichen Intelligenz namens "Go-Explore" nun beigebracht, die Atari-2600-Klassiker Pitfall von 1982 und Montezuma's Revenge von 1983 zu spielen. Bei beiden Spielen handelt es sich um frühe Formen des Jump-'n'-Run-Genres. Dabei müssen die Spieler diverse Gegenstände sammeln, Gefahren ausweichen und neue Ebenen freischalten.

Damit die KI auch solche Hindernisse überwindet, wurde auf das sogenannte "Reinforcement Learning" gesetzt. Dabei wird die KI entweder belohnt, wenn sie ein Ziel erreicht, oder bestraft, wenn sie scheitert. Jedoch stellte sich die Belohnung, also das Erreichen von gewissen Erfolgen, als zu komplex heraus.

Adrien Ecoffet

Jetzt fanden die Forscher eine Lösung für das Problem. Im Magazin "Nature" hielt man fest, dass die KI mit einem Gedächtnis versehen wurde. Das bedeutet: Spielt die künstliche Intelligenz, werden entscheidende Momente im Spielverlauf aufgezeichnet. Scheitert sie und startet eine neue Spielrunde, beginnt sie mit einer Auswertung der vorherigen Spielrunden und Zwischenschritte, die den höchsten Erfolg und schnellsten Weg zu einer Belohnung versprechen. So konnten bei beiden Spielen Erfolge verzeichnet werden. Vor allem bei Montezuma's Revenge gelang es, die Erwartungen zu übertreffen. Hier wurde ein neuer Spielrekord aufgestellt. Der alte Levelrekord von "MtnBuffalo" aus dem Jahr 2014, der Level 9 mit 1.007.100 Punkten erreichte konnte, wurde mit einer Zahl von 1.731.645 Punkten übertroffen.

Laut den Entwicklern kann diese Methode zukünftig auch in anderen Bereichen eingesetzt werden. Dies testeten sie in einem Experiment. Die KI übernahm die Steuerung eines simulierten Roboterarms, der Gegenstände in Fächer einräumen sollte. Der Lernprozess war sehr effizient und vergleichsweise schnell. (red, 2.3.2021)