Ein Fenster mit einem Google-Logo
Proschofsky / STANDARD

Aktuellen Medienberichten zufolge soll Google versehentlich tausende Seiten zur Dokumentation der eigenen Suchmaschinentechnik öffentlich gemacht haben. Die entsprechende Technologie gilt als streng geheim, eine ganze Branche – jene der Suchmaschinenoptimierung (SEO) – beschäftigt sich mit der möglichst guten Platzierung der eigenen Websites (und jener der Kunden) in den Google-Suchergebnissen. Diese Agenturen könnten durch den Leak neue Erkenntnisse gewonnen haben. Denn die dortigen Informationen widersprechen in manchen Punkten auch dem, was Google den Website-Betreibern offiziell empfiehlt.

"Lügen"

Die Medienberichte beziehen sich dabei auf den Blogbeitrag eines gewissen Rand Fishkin, dessen Unternehmen Spark Toro in der SEO-Branche aktiv ist. Er führt aus, dass er auf die angeblich auf Github veröffentlichte Dokumentation aufmerksam gemacht wurde. Diese soll durch einen automatiserten Prozess am 27. März hochgeladen und am 7. Mai wieder offline genommen worden sein. Kopien dieser Erklärungen zur "Content Warehouse API", in denen auf über 2500 Seiten mehr als 14.000 Attribute gelistet werden, sind nach wie vor abrufbar.

Die ursprünglich anonyme Quelle ging später an die Öffentlichkeit. Es handelt sich um Erfan Azimi, Gründer von EA Eagle Digital und ebenfalls SEO-Experte. Er beklagt in seinem Statement "Lügen", die Google angeblich "über Jahre hinweg verbreitet hat".

Erfan Azimi: Leaked Google Ranking Factors (Public Statement) - Rand Fishkin, Mike King
Erfan Azimi (EA Eagle Digital)

Fishkin führt in dem recht langen Blogbeitrag aus, warum der Leak aus seiner Sicht authentisch ist: Unter anderem sollen ihm ehemalige Google-Mitarbeiter bestätigt haben, dass die Dokumente Ähnlichkeiten mit einer typischen Google-Dokumentation aufweisen.

Welche Faktoren doch relevant sind

Fishkins Blogeintrag zufolge werden in der Dokumentation auch Attribute gelistet, deren Relevanz für die Reihung in den Suchergebnissen Google zuvor stets abgestritten hatte. So soll die Dokumentation beweisen, dass Google sehr wohl die Klicks im Chrome-Browser für diesen Zweck verwendet. Ebenso sollen andere Daten eingeloggter Chrome-User ebenso wie die Cookie-History einbezogen werden.

Bestraft werden Websites, deren URL exakt bestimmten generischen Suchbegriffen entsprechen (wie etwa mens-luxury-watches.com oder milwaukee-homes-for-sale.net) Während der Covid-19-Pandemie soll es eine Whitelist von Websites gegeben haben, die weiter oben angezeigt werden. Eine ähnliche Maßnahme soll es während Wahlen für Websites mit politischen Informationen geben.

Auch das Alter der Domain soll relevant sein: Entgegen der ursprünglichen Behauptung gibt es sehr wohl eine Sandbox für neu aufgesetzte Websites, in welcher diese zunächst geprüft werden, wie auch der SEO-Experte Mike King beschreibt.

Heise Online verlinkt auf eine online einsehbare Dokumentation. Der Konzern hat sich bisher noch nicht zu den Behauptungen geäußert. Zu beachten ist, dass alle hier zitierten Experten selbst in der SEO-Branche tätig sind – und somit ein entsprechendes Interesse daran haben, Aufmerksamkeit zu generieren und so ihre Leistung zu verkaufen. (stm, 29.5.2024)