02. Dezember 2019
Ob Podcasts, digitale Sprachassistenten oder Smart Speaker: Das Thema Voice ist nicht nur ein Techniktrend, sondern in der Mitte unseres Alltags angekommen. Allein 100 Millionen Endgeräte mit Amazons Alexa wurden nach Angaben des Konzerns weltweit verkauft und Experten erwarten, dass bereits im nächsten Jahr etwa die Hälfte aller Suchanfragen im Netz per Stimme erfolgt und nicht mehr über eine Tastatur. Grund genug, dass wir uns bei t-online.de mit diesem weiten Feld befassen. Nach zwei Jahren intensiver Arbeit am Thema zeigt sich: An vielen Stellen steht die Technologie noch am Anfang. Wer Voice-Produkte mit echtem Mehrwert für die Nutzer anbieten will, muss den Mut zu Experimenten haben, technische Expertise entwickeln und am Ball bleiben.
Bei t-online.de (Ströer Digital Publishing GmbH in Frankfurt und Ströer News Publishing GmbH in Berlin) begann das Voice-Experiment vor knapp zweieinhalb Jahren mit der Einführung von Amazons Echo, besser bekannt unter dem Namen seines Betriebssystems Alexa. Die Frage war, wie wir Inhalte der Redaktion von t-online.de darüber verfügbar machen können. Im Fokus stand der Alexa-„Skill“, also die Fähigkeit des Amazon-Geräts, auf eine bestimmte Aufforderung zu reagieren. Würden Nutzer Nachrichten akzeptieren, die ihnen von einer (wenn auch sympathischen) synthetischen Stimme vorgelesen werden?
Allein aufgrund der enormen Verbreitung von Android hatten wir neben Alexa auch schon früh den Google Assistant im Blick.
In der Entwicklung zeigten sich große Unterschiede zwischen Alexa und Google Assistant. Mit unserem Ziel, beim t-online.de News-Skill einen möglichst natürlichen Interaktionsverlauf per Spracheingabe nachzuzeichnen, stießen wir bei Amazon beispielsweise schnell an Grenzen: Im Gegensatz zum Google Assistant, der tatsächlich versucht, Suchanfragen im Sinne des Nutzers zu verstehen, muss für Alexa eine Benutzerschnittstelle für die Sprachein- und ausgabe erstellt werden, ein sogenanntes Voice User Interface (VUI). Dort wird unter anderem festgelegt, welche Kommandos Alexa versteht, welche Fragen gestellt werden können und welche Antworten Alexa geben soll. Kommandos, die das Skript nicht vorsieht, kann das System nicht abbilden. Vor allem aber kann es nicht dazulernen.
Noch deutlicher klafften Wunsch und Wirklichkeit dann beim Praxistest im Markt auseinander: Die Nachfrage nach vorgelesenen Nachrichten war deutlich geringer als zunächst angenommen. Nutzer bevorzugen eher einfache Nutzungsszenarien wie „Alexa, erzähl mir einen Witz“. Unser Skill hört deshalb jetzt unter anderem auf „Alexa, was sind die Nachrichten?“ und liefert dann die Voice-Version des „Tagesanbruch“-Newsletters von t-online.de Chefredakteur Florian Harms.
Ein Podcast-Format für den „Tagesanbruch“ war unser zweites großes Voice-Projekt, und es verlief von Anfang an vielversprechend. Für unsere Wahrnehmung als Medienmarke spielt der „Tagesanbruch“ als inhaltliches Flaggschiff eine zentrale Rolle. Wir haben daher bei der Entwicklung des Formats bewusst auf professionelle Sprecher gesetzt. Der „Tagesanbruch“ punktet darüber hinaus mit seiner journalistischen Form: Hier werden Nachrichten nicht einfach nur vermeldet, sondern erklärt, kommentiert und eingeordnet. Damit haben wir einen Nerv getroffen, wie die stetig steigenden Nutzerzahlen zeigen. Pro Woche erzielt der Podcast mehr als 30.000 Abrufe über alle Plattformen. Besonders erfreulich ist, dass wir vor allem auf externen Plattformen wachsen – und das ganz ohne Werbemaßnahmen.
Um über den „Tagesanbruch“ hinaus auch kurzfristig Audiobeiträge wie Interviews oder Kolumnen produzieren zu können, haben wir inzwischen ein eigenes Tonstudio in den Räumen der Redaktion in Berlin eingerichtet und arbeiten dort mit einem eigenen Voice-Redakteur.
Unser Fazit: Hochwertig produzierte, journalistische Inhalte haben eine gute Chance, auf dem Voice-Markt herauszustechen und erfolgreich zu sein.
Auch wenn Voice noch vielfach experimentellen Charakter hat, wird es sich als Zugangsweg zu bestimmten Informationen und Diensten etablieren. Dies wird hauptsächlich von den Fähigkeiten der Endgeräte-Software abhängen, die durch die Fortschritte bei Machine Learning und künstlicher Intelligenz stetig verbessert werden. In jedem Fall stehen wir aber erst am Anfang der Entwicklung.
Deshalb arbeiten wir weiter daran, unsere Erfahrung mit Voice auszubauen und neue Konzepte zu validieren. Wie gut die Ideen sind, die wir für Voice-Nutzer entwickeln, hängt dabei ganz schlicht auch an der Intensität, mit der wir die Geräte und ihre Möglichkeiten selbst nutzen. Aus diesem Grund hat Alexa einen festen Platz in unserer Berliner Redaktion – oder vielmehr viele Plätze, denn die Amazon-Geräte finden sich dort überall. Dass Alexa zum redaktionellen „Morgenbriefing“ dank einer Anbindung an unser Data-Warehouse wichtige Kennzahlen vorträgt wie den mobilen Anteil am t-online.de-Traffic, die bestlaufenden Artikel oder die Gesamtzahl der Visits, ist täglich gelebte Routine. Entscheidend ist für uns dabei, auf der Welle zu surfen statt ihr hinterherzuschauen.
Andreas Sprenger, Head of New Business, kümmert sich mit seinem Team bei der Ströer Digital Publishing GmbH um die Geschäftsfeldentwicklung der t-online.de