Voice im barrierefreien Design

Bis zum Jahr 2030 soll Voice Commerce in Deutschland knapp ein Drittel aller E-Commerce-Umsätze ausmachen. Über die Chancen und Risiken einer Technologie, die immer noch am Anfang steht – und deshalb enormes Entwicklungspotenzial besitzt.
In der gleichen Zeit, in der das Gehirn ein Bild verarbeitet, kann es circa sechs bis acht Worte verarbeiten. (© Unsplash/Tron Lê)

Von Stefan Rommel; Mitarbeit Hannah Klaiber

Wer die Welt nicht sehen kann, der muss sie hören: Diese Perspektive passt zum längst nicht mehr nur von Experten angekündigten „Internet of Voice“. Denn dass das wichtigste Medium unserer Zeit sich immer mehr auf das Hören als leistungsfähigsten Sinn des Menschen einlässt, sollte keine Überraschung mehr sein. Vielmehr stellt sich die Frage, warum Voice als Aspekt im barrierefreien Design so lange ein vergleichsweise stiefmütterliches Dasein fristen konnte – und welche Chancen sich dafür in allen Bereichen ergeben.

Der Hörsinn des Menschen ist der differenzierteste überhaupt und deutlich leistungsfähiger als etwa das Auge. Auch wenn rund 80 Prozent aller sensorischen Informationen über die Augen erfasst und ans Gehirn weitergeleitet werden – Worte werden schneller verarbeitet als Bilder. Als Faustregel gilt: In der gleichen Zeit, in der das Gehirn ein Bild verarbeitet, kann es circa sechs bis acht Worte verarbeiten.

Diese Effizienz schlägt sich auch in der Internetnutzung nieder. Eine Studie der Medienagentur OMD vom Herbst 2021 belegt, dass bereits 52 Prozent der deutschen Online-User*innen aktiv Voice-Assistenten nutzen. Bis zum Jahresende 2022 sollte die Zahl auf bis zu 60 Prozent klettern. Dieser Trend wird sich in den kommenden Jahren fortsetzen.

Voice wird im barrierefreien Raum wichtiger

In 33 Prozent der deutschen Haushalte standen zum Zeitpunkt der Studie bereits Smart Speaker, zum Ende des ersten Quartals 2022 soll sich die Verbreitung der Geräte auf bis zu 50 Prozent erhöhen. Bei den Smart Speakern mit Display – dazu gehören unter anderem Smartphones, Smart TVs oder Tablets – gab es zwischen 2019 und 2021 eine Steigerungsrate um fast 100 Prozent, der Anteil pro Haushalt wuchs von 23 Prozent auf 45 Prozent.

22 Prozent der 1504 Befragten nutzen ihre Sprachassistenten mindestens einmal täglich, 30 Prozent immerhin noch mehrmals wöchentlich. Jede fünfte Suchanfrage in Deutschland wird mittlerweile über Sprachsteuerung getätigt. Der Trend ist eindeutig: Voice wird als Aspekt im barrierefreien Raum immer wichtiger. Aber wie können Unternehmen damit arbeiten? Was bedeutet das für ihre Markenbildung? Und wie beeinflusst Voice Search das Kaufverhalten der Kund*innen?

Grundsätzlich unterscheiden sich die Plattformen entsprechend ihren unterschiedlichen Geschäftsmodellen in ihrer Suchlogik. Während bei Amazon die Suche nach einem Skill, also deren Voice-App, sowie die Auffindbarkeit im Marketplace an erster Stelle stehen – und überdies die Websuche relativ wenig Optimierungsmöglichkeiten bietet –, greift bei Google die Suchlogik aus dem Web. „Hier gilt es, hinsichtlich Featured Snippets zu optimieren und die Datenstrukturen der Website entsprechend anzupassen. Die bisherige Optimierung reicht für die Voice-Plattformen also nicht aus“, sagt Sven Rühlicke, Geschäftsführer von Wake Word, einer der führenden Full-Service-Voice-Agenturen des Landes.

Das Kernproblem bleibt dabei eine natürliche und nicht zu umgehende Verknappung: Über Voice Search erhalten User*innen einen bis maximal drei Treffer. Da ist es für jeden Anbieter enorm schwer, ins Relevant Set der Nutzer zu kommen oder dort zu bleiben. Deshalb ist Voice Search auch eher als Einstieg in eine kleine Reise zu betrachten: Sie beginnt mit dem ersten Berührungspunkt der Kund*innen mit der jeweiligen Marke, der Dienstleistung oder dem Produkt und endet in der Conversion. Den Einstieg über den Touchpoint schafft die Voice Search. Eine echte Auffindbarkeit oder klassisches Voice Commerce gibt es nicht.

Umso wichtiger sind Search-Analysen für die (großen) Marken auf beiden Plattformen, die in der Regel mehrere Tausend Fragen umfassen. Für Unternehmen gilt: Es reicht nicht, die Website oder die App mal eben umzubauen. Für einen nachhaltigen Erfolg sollte eine Marke ganzheitlich auf Spracherkennung transformiert werden.

Voice als Baustein beim Onlineshopping

Die individuelle Beratung gilt im Einzelhandel als hohes Gut und hat während der Pandemie noch einmal eine größere Wertschätzung erfahren. Die Wachstumschancen des Einzelhandels haben sich aber längst in die digitale Welt verlagert und erfahren durch den Baustein Voice eine ganz neue Tiefe. Die 24/7-Verfügbarkeit des Algorithmus ist unschlagbar und seine Fähigkeit, mit den Bedürfnissen des Kunden zu wachsen und aus ihnen zu lernen, ist ein großer Vorteil. Die schnelle Kaufabwicklung ohne lästiges Tippen am Endgerät sehen 46 Prozent der Befragten als enormen Nutzen, weil es Zeit spart und durch die Freihandtechnologie auch andere Tätigkeiten nebenbei zulässt. Die Sprachsteuerung macht das Einkaufen per se ebenso individuell wie komfortabel; die Beratung wird personalisiert und dabei optimiert.

Chatbots mögen in ihrer Ausprägung noch immer etwas gewöhnungsbedürftig sein, als Inspirationsquelle und im Zusammenspiel mit den Kund*innen funktionieren sie mittlerweile aber sehr gut. Und sie lernen mit: Je öfter der Bot benutzt wird, desto präziser und besser wird er. Wobei sich die Kategorien, in denen Voice Commerce schon überdurchschnittlich häufig genutzt wird, zum Teil deutlich unterscheiden. Dinge des täglichen Bedarfs gehören ebenso dazu wie die Sparte der Consumer Electronics und Elektrogeräte.

Über die Chatbots gelangen Kund*innen oft zu Produkten, die sie sonst nicht gefunden hätten. 55 Prozent der Befragten sehen darin einen klaren Vorteil. Trotzdem gibt es auch immer noch einige veritable Nachteile und Bedenken der Nutzer*innen. In der Regel ist die Beratung beim Onlineshopping genau das, was sie verspricht: eine Beratung – der Kaufabschluss erfolgt meist auf einer anderen Plattform.

Es gilt, weitere Hürden zu überwinden: 25 Prozent der im Rahmen der OMD-Studie Befragten fühlen sich grundsätzlich unwohl damit, ein Gerät zu besitzen, das permanent zuhört und Daten sammelt. Einer anderen Gruppe war gar nicht bewusst, dass sie per Sprachbefehl einkaufen können, oder sie haben schlicht Angst davor, am Ende das falsche Produkt zu erhalten. Und über allem stehen zwei ganz natürliche Probleme: Der Dialog mit dem Bot und das Aufgeben einer Bestellung gelingen nur dann, wenn die Konversation mit einer sehr präzisen Aussprache erfolgt. Sehen oder anfassen kann man das Produkt überhaupt nicht.

Voice im Content-Marketing

Laut einer Deloitte­Studie könnte Voice Commerce bis 2030 in Deutschland rund 30 Prozent der E-Commerce-Umsätze ausmachen. Für Unternehmen besonders interessant ist deshalb die An- und Verwendung der Technologie im Marketingumfeld. Schon die Zielgruppe allein dürfte riesig sein: Menschen, die durch körperliche Einschränkungen wie eine Sehbehinderung, eine Lese-Rechtschreib-Schwäche oder Analphabetismus eingeschränkt oder benachteiligt sind, profitieren von Voice Search. Auch ältere Menschen, die mit einem mobilen Endgerät oder dem Schreiben auf einer Tastatur nicht vertraut oder überfordert sind, gehören zur Zielgruppe.

Für das Content-Marketing heißt das: Die Strategie sollte produzierte Audioelemente umfassen, um auch das auditive Markenerlebnis mit zu transportieren. Als Grundlage dafür sieht Wake-Word-Chef Rühlicke fast schon zwingend ein Audio-Branding des Unternehmens. „Bei Informationen, die sich über einen Satz mit 30 bis 50 Wörtern erstrecken, ist es schwierig, den Nutzer auch zu halten. Deshalb bieten kürzere Elemente ganz andere unterhaltende und emotionale Komponenten“, sagt Rühlicke. Parallel könne der Content dann auch über eigene Podcast-Formate distribuiert werden.

Dieser Artikel erschien zuerst in der März-Printausgabe der absatzwirtschaft.