Ein Lieferroboter von Yandex in den Straßen Moskaus.

Foto: EVGENIA NOVOZHENINA, Reuters

Was Google im Westen ist, ist Yandex im russischen Raum. Das Unternehmen bietet nicht nur Websuchen, sondern auch Kartendienste, Navigation, Nachrichten, Wetter, einen kostenlosen Mailservice und Übersetzungssoftware an.

Ein Teil des Quellcodes, also des "Maschinenraums" der Suchmaschine, tauchte nun im Netz auf. Die Daten wurden angeblich von einem ehemaligen Mitarbeiter des russischen Technologieunternehmens gestohlen und als Torrent in einem beliebten Hackerforum veröffentlicht. Die Daten dürften dem Unternehmen im Juli 2022 gestohlen worden sein. Es handelt sich insgesamt um 44,7 Gigabyte an Code-Repositories, ein Teil des technischen Fundaments des Unternehmens wurde also geleakt.

Das stellt einen schweren Schlag für das Unternehmen dar, enthält das Paket doch Daten über die Suchmaschine und darüber, wie der Indexing-Bot funktioniert, Karten, eine KI-Assistentin namens Alisa, Mailservices, Buchungsplattformen, Cloudspeicher, Yandex Pay sowie Codes des internen Analysetools Yandex Metrika.

Einblicke ins Unternehmen

Bei Yandex selbst betont man, dass es sich nicht um einen Hack, sondern um Datendiebstahl handle. "Yandex wurde nicht gehackt. Unser Sicherheitsdienst fand Code-Fragmente aus einem internen Repository in der Öffentlichkeit, aber der Inhalt unterscheidet sich von der aktuellen Version des Repositorys, das in Yandex-Diensten verwendet wird", teilte ein Unternehmenssprecher mit.

Repositorys sind eine Art Projektarchiv, das es Entwicklerinnen und Entwicklern möglich macht an, unterschiedlichen Versionen eines Produkts zu arbeiten, wobei sämtliche Änderungen dokumentiert werden. Derartige Systeme sind für die Zusammenarbeit in großen Teams unerlässlich, da nur so die unterschiedlichen Änderungen in ein großes Gesamtprodukt einfließen können.

Tatsächlich dürften in dem geleakten Material keine persönlichen Daten der Nutzerinnen und Nutzer von Yandex enthalten sein, wie "Bleeping Computer" berichtet. Der Leaker dürfte auch keine finanziellen Interessen verfolgen, stellte er doch die Daten öffentlich ins Netz. Aber: Tiefe Einblicke in den russischen Tech-Riesen erlaubte das geleakte Material sehr wohl.

So dauerte es nicht lange, bis interessierte Hacker den Quellcode auseinandernahmen. Dabei fanden sie eigenartige Zensurmechanismen und offenen Rassismus. Wie der kanadische Hacker Aubrey Cottle feststellte, enthält der Code ethnische Beleidigungen. Darin kann man ganze Sätze mit dem N-Wort finden.

Missbrauchsfilter zensiert Fragen zu Putin

Darüber hinaus zeigt der Code von Yandex, dass das Unternehmen Kritik an Putin ausfiltert. Dafür hat das Unternehmen den eigenen Kinderpornofilter so umgestaltet, dass dieser auch unerwünschte Inhalte über den russischen Diktator entfernt. Sucht man beispielsweise "wann wird er sterben", dann ersetzt Yandex die Abfrage durch "wann wird er sterben – (minus) Putin", sodass Ergebnisse über den russischen Präsidenten nicht ausgegeben werden.

Bildabfragen funktionieren ähnlich: Wenn ein Nutzer nach dem "Z-Symbol" sucht, werden mögliche Parallelen zu Nazideutschland ausgefiltert.

Erstaunlich fanden die Hacker aber auch einige sehr originelle Wege, wie die russischen Nutzerinnen und Nutzer die smarten Lautsprecher von Yandex abschalten. Ähnlich wie seine westlichen Pendants dürfte dieser eine Neigung zum Plappern haben, weshalb sich im Code auch eine Liste von derbsten Beschimpfungen wiederfand – bis hin zur Drohung Alisa zu töten. (pez, 1.2.2023)