Mit dem Pixel 4 wird Google in wenigen Tagen seiner Smartphone-Serie einen neuen Eintrag hinzufügen. Was diese bringen wird, ist aber auch jetzt schon kein großes Geheimnis mehr, sind doch bereits praktisch alle Details durchgesickert. Und das betrifft nicht nur die Hardware, auch im Hinblick auf die Softwareausstattung ist schon vieles bekannt. Wobei "bekannt" genau genommen zu vorsichtig formuliert ist, wurden doch sogar einzelne Apps für das Pixel 4 "geleakt". Und darunter findet sich auch ein besonders interessantes Exemplar: eine komplett neue App, die auf neuen Google-Smartphones vorinstalliert sein wird.

Achtung, Aufnahme!

Unter dem schlichten Namen "Recorder" hat Google eine eigene App zur Sprachaufnahme entwickelt. Das klingt zunächst wenig aufregend, schließlich gibt es solche Apps im Play Store zuhauf. Bei Apple ist ein entsprechendes Programm sogar schon seit längerem vorinstalliert. Und doch handelt es sich dabei wohl um die beste neue App, die Google seit längerem entwickelt hat, wie ein Kurztest veranschaulicht.

Die Recorder-App auf einem Pixel 3 XL (mit durch die Suchfunktion markierter Stelle).
Foto: Proschofsky / STANDARD

Spurensuche

Auf den ersten Blick zeigt sich hier das zu Erwartende: ein simples User-Interface, in dessen Mitte ein Aufnahmeknopf prangt – samt dem Hinweis, dass man doch bitte nicht einfach ungefragt Leute damit belauschen soll. Startet man eine Aufnahme, zeigt sich zunächst eine Visualisierung der Tonspur in Wellenform – auch das kennt man von anderen Apps dieser Kategorie. Wer genau hinsieht, dem wird aber noch ein anderer Knopf auffallen, der den Namen "Transkription" trägt. Und dieser hält, was er verspricht: Findet sich dahinter doch eine vollständige Niederschrift des Gesprächs, wer will, kann hier sogar live mitverfolgen, wie die App die Konversation Wort für Wort festhält.

Bevor die Erwartungen allzu hoch werden, vorab eine wichtige Info: Aktuell funktioniert das Ganze nur mit englischen Spracheingaben. Google verspricht aber schon in der App, dass bald weitere Sprachen folgen sollen. Ist diese Voraussetzung erfüllt, eröffnen sich dadurch mächtige Möglichkeiten. So können auch sämtliche Aufnahmen zentral durchsucht werden. Die App schlägt dann nicht nur alle Dateien vor, in denen der gesuchte Begriff enthalten ist, beim Anwählen wird auch gleich auf die passende Stelle gewechselt. Genauso ist es möglich, innerhalb einer Datei ein Wort auszuwählen und damit zur entsprechenden Position in der Tonaufnahme zu wechseln.

Details

Neben Gesprochenem erkennt die App auch noch einzelne Audio-Events wie "Lachen", "Musik" oder "Applaus", die in der Niederschrift extra gekennzeichnet werden. Zudem ist jedem dieser "Events" eine eigene Farbe zugewiesen, womit auch in der Wellenform-Darstellung gleich sichtbar ist, wo Sprache und wo andere Geräusche zu vernehmen sind.

Die Recorder-App beim ersten Start und eine markierte Stelle in der Wellenform-Darstellung.
Screenshots: Proschofsky / STANDARD

Wie gut klappt es?

Die Qualität der Texterkennung hängt natürlich stark von Umgebungsfaktoren ab. Je deutlicher die Aussprache, je weniger Nebengeräusche, desto besser funktioniert es. Und natürlich gibt es gewisse Dinge, mit denen so ein automatisches System immer Probleme haben wird, etwa Namen. Ansonsten klappt die Erkennung im Test aber wirklich sehr gut, mit ein paar manuellen Eingriffen lässt sich hier eine ziemlich akkurate Niederschrift erstellen.

Die Speicherung der Tonaufnahmen erfolgt parallel sowohl in Audioform als auch als Textdatei. Wer Inspiration für einen Titel sucht, dem schlägt die App Highlight-Begriffe aus dem Inhalt vor. Wer will, kann zudem den Standort der Aufnahme mitspeichern, um sich später noch besser an die Rahmenbedingungen zu erinnern.

Der Clou

Besonders interessant macht die App aber noch ein weiteres Merkmal, und zwar eines, das komplett Google-untypisch ist: All das funktioniert nämlich komplett offline. Die Spracherkennung findet lokal auf dem Gerät statt, die resultierenden Daten verlassen also ohne expliziten Wunsch der Nutzer nie das eigene Smartphone. Wer will, kann die Aufnahmen zwar natürlich gezielt mit anderen teilen oder auf Google Drive hochladen – aber all das ist wie gesagt strikt optional. Bleibt zu hoffen, dass Google diesen Ansatz künftig auch bei anderen Apps in den Vordergrund stellt, also Offline-Apps mit optionaler Cloud-Anbindung statt einer fixen Integration derselben. Aus Privacy-Sicht wäre das jedenfalls ein großer Gewinn.

In der Textfassung wird beim Abspielen das gerade aktive Wort markiert, wer will, kann durch Berühren eines Begriffs aber auch direkt zu diesem wechseln. Beim Abspeichern macht die App zum Inhalt der Aufnahme passende Vorschläge für die Benennung.
Screenshot: Proschofsky / STANDARD

Download

Wer die Recorder-App selbst ausprobieren will, muss vorerst noch zu alternativen Wegen jenseits des Play Stores greifen. So kann sie etwa bei APKMirror heruntergeladen werden. Dass sie von Google stammt ist dabei übrigens trotzdem gewährleistet, da sie mit dem entsprechenden Schlüssel des Unternehmens signiert ist. Zudem sei betont, dass die Offline-Spracherkennung natürlich eine Herausforderung für die lokale Hardware ist, insofern ist nicht gesichert, dass dies auch auf allen Geräten zuverlässig funktioniert. Im Test auf einem Pixel 3 klappte die Transkription jedenfalls reibungslos. Ob eine iOS-Version geplant ist, ist derzeit noch unklar. (Andreas Proschofsky, 13.10.2019)