Elbkind-CEO Rymar: „Voice ist kein Werbekanal“

Stefan Rymar glaubt an die zunehmende Relevanz von Sprache im Alltag sowie im Marketing der Zukunft. Doch der CEO der Hamburger Agentur Elbkind Reply legt im Interview auch den Finger in die Wunde: Viele Marken würden Voice-Anwendungen noch nicht verstehen und es gebe nur wenige vergleichbare KPIs.
Smart Speaker
Smart Speaker: "Amazon sitzt genau wie die anderen Anbieter auf den Daten." (© Bence Boros / Unsplash)

Herr Rymar, würden Sie Ihren Kunden Voice-Anwendungen über Sprachassistenten als Marketing-Plattform empfehlen?

STEFAN RYMAR: Anwendungen für Sprachassistenten sind dann sinnvoll, wenn sie bequemer oder schneller zu einer Leistung oder Information führen. Sie ersetzen Vorgänge, für die ein Nutzer ansonsten ein anderes Device wie ein Smartphone oder eine zweite Person benötigt. Das heißt im Umkehrschluss: Ein Voice Assistant ist kein Werbekanal und nicht dafür da, Werbung zu transportieren. Kein Nutzer möchte einen Assistenten, der ihm erstmal Schweinebauch-Anzeigen vorliest. Oder der einem gleich fünf andere Magazine anbietet, wenn man sich zuvor für eins entschieden hat.

Haben Sie das Gefühl, dass die werbungtreibende Industrie den Nutzen von Voice-Anwendungen schon verinnerlicht hat?

Grundsätzlich fällt uns auf, dass Marken bei ihren Ansätzen für Voice-Anwendungen noch nicht über das Kundenbedürfnis, sondern über die Technologie-Option kommen, sprich: Von der Reihenfolge her ist es oft so, dass sich die Marketingabteilungen vieler Unternehmen überlegen, wie sie mit einer neuen Technologie umgehen, wenn diese am Markt ist. Ich finde diese Denke komplett falsch. Marketingabteilungen sollten vielmehr schauen, was ihre Leistungen sowie die Bedürfnisse ihrer Kunden sind. Und wenn dann eine Technologie da ist, die das abbilden kann, dann ist deren Einsatz sinnvoll.

Sind Voice-Anwendungen im Marketing für jedes Unternehmen geeignet?

Das ist total schwer zu beantworten. Ich würde per se keine Branche ausschließen. Aber wenn ich mir als Shampoo-Marke erhoffe, beispielsweise mit einer Voice-Anwendung mehr Shampoo zu verkaufen oder meine Kundenbedürfnisse zu befriedigen, dann muss ich schon ziemlich um die Ecke denken. Ansonsten entstehen komische Auswüchse wie konstruierte Dusch-Playlists, die aber nichts bei Sprachassistenten verloren haben.

Was bedeutet das im Umkehrschluss für interessierte Marken?

Wie bei jeder neuen Technologie oder Innovation müssen sich Marken die Sinnfrage stellen. Mein Rat ist, nichts Unglaubwürdiges zu konstruieren. Grundsätzlich ist Voice als Interface extrem spannend, damit sollte sich jeder auseinandersetzen. Aber wenn es nur als nächster Vermarktungskanal gesehen wird, weil die anderen nicht mehr funktionieren, dann können es Unternehmen gleich sein lassen. Kunden müssen ja zuhören und können weder klicken noch scrollen. Sie müssen alles verstehen und verarbeiten. Die Chance, dass dieses Erlebnis sehr frustrierend ist, weil nichts Hilfreiches passiert, ist sehr hoch.

Was macht Voice-Anwendungen so speziell?

Sprache ist wirklich anders, als alles andere, was wir bisher im Marketing so gemacht haben – mal abgesehen von Radio als sprachbasiertem Kanal. Bei Voice-Anwendungen geht es auf einmal um eine Ebene, auf der ich nicht lesen muss und es auch keinen Bildschirm gibt. Mit dem Ohr wird ein anderer Sinn angesprochen und gleichzeitig werden andere blockiert. Wenn ich Alexa zuhöre und andere Dinge parallel mache, erfordert das eine hohe Konzentration. Das bedeutet für das Marketing, dass ich mir echt intensive Gedanken für einen Use Case machen – und umdenken muss.

Was heißt das für die Erstellung von Voice-Anwendungen?

Wenn ich beispielsweise im Internet lese, bestimme ich als Kunde selbst, was ich konsumiere, wie schnell ich konsumiere und wohin ich klicke. Auf der akustischen Ebene geht das nicht. Da kann ich nicht einfach Sachen ausblenden oder nur Teile mitnehmen. Entweder ich höre aufmerksam zu – oder eben nicht. Das heißt: Sie dürfen als Marke weder langweilen noch nerven. Das gilt natürlich für jede Marketingaktivität. Aber wir Marketingleute neigen ja dazu, Botschaften inflationär abzufeuern, wenn wir einmal den Fuß in der Tür haben. Und im Voice-Bereich darf man das einfach auf gar keinen Fall machen. Denn man schwört damit das sofortige Ende der Nutzer-Interaktion herauf. Deswegen sollte bei der Erstellung von Voice-Anwendungen allergrößter Wert auf das User-Experience-Design gelegt werden.

Worauf kommt es bei der Erstellung von Voice-Anwendungen konkret an?

An Voice interessierte Unternehmen freuen sich oft, dass sie auf optischer Ebene nichts mehr designen müssen. Das stimmt auch, doch sie müssen es stattdessen auf akustischer Ebene. Und das ist in der Regel weitaus komplexer. Für die Anwendung „TK Smart Relax“ der Techniker Krankenkasse mussten beispielsweise mehr als 50 „Entspannungsreisen“ zwischen fünf und 20 Minuten erstellt werden. Es ist ganz schön herausfordernd, die alle auf die Qualität der Nutzerführung zu testen. Das allein kann Tage dauern. Auch die Anpassung von Audio-Inhalten ist sehr aufwendig, da in der Regel mit extern gebuchten Sprechern gearbeitet wird. Voice-Testing ist etwas völlig anderes, als sich eine Website anzugucken und auf Optimierungsmöglichkeiten zu checken. Das sollte niemand unterschätzen.

Stefan Rymar, CEO Elbkind Reply

Von Bixby (Samsung) über Alexa (Amazon) bis zum Google Assistant gibt es diverse Sprachassistenten. Auf welchen Plattformen sollten Marken mit ihren Voice-Anwendungen unbedingt präsent sein?

Die Frage ist so ähnlich wie früher in der App-Entwicklung: Nehme ich iOS oder Android? Denn Beides ist zu teuer. Klar ist: Will ich eine Voice-Anwendung auf mehreren Plattformen anbieten, muss ich auch mehrere Entitäten pflegen. Man kann nicht einfach eine Anwendung bauen und diese dann auf verschiedenen Assistenten ausspielen. Es stellt sich also die Frage nach der Marktdurchdringung. Amazon Alexa ist da momentan einfach eine Bank. Auch weil die Technik mittlerweile in vielen IoT-Anwendungen eingebaut ist. Google wird mit Smart Home auch nicht gleich wieder in der Versenkung verschwinden. Dann hört es, Stand heute, aber meines Wissens nach auch schon auf.

Marktdurchdringung ist ein gutes Stichwort. Sie schreiben auf Ihrer Website, dass Sie den Alexa-Skill „TK Smart Relax“ mit 8500 zufriedenen Nutzern und insgesamt 65.000 Interaktionen im ersten Monat etablieren konnten. Ist das jetzt viel oder wenig?

Ganz ehrlich, das ist tatsächlich ein wunder Punkt. Man sieht beispielsweise bei Alexa zwar, welche Skills wie oft abgerufen wurden, und welche Titel innerhalb des Skills wie oft abgespielt wurden. Aber tiefgehende Data-Insights-Programme, wie man sie von Social-Media- und Digitalkampagnen kennt, gibt es nicht. Amazon sitzt genau wie die anderen Anbieter auf den Daten. Ich kann demnach anhand quantitativer KPIs also nicht wirklich gute Auswertungen machen, sondern lediglich qualitativ Feedback auswerten. Diese Tatsache macht es für viele Unternehmensentscheider zum Problem, Budget für Voice-Anwendungen zu bekommen.

Glauben Sie daran, dass sich das künftig ändern könnte?

Das kann ich nicht beurteilen. Aber es ist theoretisch nicht unbedingt damit zu rechnen, dass Amazon, Google & Co. möchten, dass ihre Voice-Assistenten zu sehr zum Werbetool werden. Denn es dürfte ihnen nicht gefallen, dass es eine Fülle an Skills beziehungsweise Actions gibt, die weder einen Sinn haben noch einen Mehrwert bieten.

Sie wollen weitere relevante Informationen und spannende Hintergründe für Ihre tägliche Arbeit im Marketing? Dann abonnieren Sie jetzt hier unseren kostenfreien Newsletter.

(he, Jahrgang 1987) – Waschechter Insulaner, seit 2007 Wahl-Hamburger. Studierte Medien- und Kommunikationswissenschaften und pendelte zehn Jahre als Redakteur zwischen Formel-1-Rennstrecke und Vierschanzentournee. Passion: Sportbusiness. Mit nachhaltiger Leidenschaft rund um die Kreislaufwirtschaft und ohne Scheuklappen: Print, live, digital.