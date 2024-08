Eric Siegmund gerät schnell ins Schwärmen, wenn er über Künstliche Intelligenz (KI) spricht: „Wir haben allein seit Jahresbeginn 2024 nochmal einen riesigen Schritt in der Entwicklung erlebt“, sagt er. Den praktischen Nutzen verdeutlicht der Business Development Manager beim Audiovermarkter RMS am eigenen Beispiel: Als während einer Kehlkopfentzündung seine Stimme schonen musste, hinderte ihn das nicht daran, Sprachnachrichten zu versenden. Er ließ die geschriebenen Sätze einfach von der KI mit seiner binnen einer Minute geklonten Stimme einsprechen. Auf Wunsch lässt sich das sogar simultan in unterschiedliche Sprachen übersetzen. „Selbst Native Speaker merken nicht, dass hier kein Muttersprachler spricht“, sagt Siegmund.

Eric Siegmund ist Tech-Fachmann und Business Development Manager bei RMS. (© RMS)

Dann zitiert er eine Europol-Prognose, laut der bis zum Jahr 2026, also in zwei Jahren, 90 Prozent allen Contents synthetisch generiert sein werden, also neben Texten und Videos auch Audio-Inhalte. Und wie viele Inhalte sind – Stand heute – bei RMS, einem der führenden Audio-Werbevermarkter, mit KI generiert? „Weniger als fünf Prozent“, schätzt Siegmund. Doch der Trend gehe klar weiter in diese Richtung.

Produktionszeit auf unter eine Stunde verkürzt

Um am Ball zu bleiben, setzt der Audiovermarkter auf einen KI Spot Creator. Die vom internationalen Technologie-Anbieter AudioStack entwickelte Plattform ermöglicht eine vollständig automatisierte und skalierbare KI-basierte Audioproduktion mit Text-to-Speech, Voice-Cloning und KI-basierter Postproduktion. Es ist laut dem Unternehmen das erste Tool, das den gesamten Kreationsprozess mit KI realisiert. Der Anbieter verspricht, mit seinen KI-Lösungen den gesamten Produktionsprozess bei der Erstellung von Audiospots in nur acht Sekunden abzudecken.

Mit dem KI Spot Creator von AudioStack lässt sich in wenigen Sekunden ein Spot erstellen: Text eingeben, Sprecherstimme auswählen, Musik auswählen und auf „Produzieren“ klicken. (© RMS)

Was das heißt, verdeutlicht Siegmund anhand von einem Vergleich: „Die Produktionszeit von der Idee bis zum fertigen Werbemittel sinkt von einigen Tagen auf weniger als eine Stunde.“ Weil weder ein Tonstudio noch ein*e professioneller Sprecher*in nötig sind, sinken natürlich auch die Kosten. Siegmund spricht im Vergleich zu einer Studioproduktion von signifikantem Einsparpotenzial je nach Zielstellung und Anforderung des Kunden.

Bewahrheitet sich hier also die Horrorvision aller Kreativen – in diesem Fall eben der Tonstudiobetreiber*innen und professionellen Sprecher*innen –, dass ihre Jobs von der KI wegrationalisiert werden?

SunExpress Airlines mit erstem KI-generierten Spot

Eric Siegmund versteht die Ängste, betont jedoch das enorme Potenzial: Die innovative Technologie eröffne neue Möglichkeiten, die es so vorher gar nicht gegeben habe, etwa in der Kundenakquise. Die Verkäufer*innen des Audiovermarkters würden nun beispielsweise mit im Handumdrehen generierten Showcase-Spots auf bestehende und potenzielle neue Kunden zugehen. Werbetreibende, denen das Testen von Audiowerbung bisher zu teuer und aufwändig war, erhalten mit dieser technologischen Lösung unkompliziert eine passende Kreation zu einem vergleichsweise niedrigen Preis.

Damit sinke die Einstiegshürde in die Kommunikation via Audio deutlich, wie er am Beispiel SunExpress verdeutlicht: Die Fluggesellschaft hatte zuvor nicht auf Audiowerbung gesetzt und war Ende 2023 der erste Kunde, der einen KI-Radiospot bei RMS beauftragt hat. Der Spot thematisiert neben dem Produkt auch die Erstellung des Spots von einer KI – und positioniert SunExpress so als innovativen Underdog im Markt.

Wofür ist ein Einsatz von KI sinnvoll – wofür nicht?

Allerdings, so räumt Siegmund ein, sei KI für die Kreation von Audiowerbung in der heutigen Form nicht für alle Kunden und Kampagnen das richtige Werkzeug. Zwar sei technisch schon vieles möglich. Allerdings rechne sich bei aufwändigeren Produktionen der zusätzliche Aufwand in der Post-Production nicht immer. Kurz gesagt: Hier ist es sinnvoller, gleich bei der klassischen Produktionsweise zu bleiben. Als Beispiele nennt der Fachmann Konversationen zwischen zwei oder mehr Sprecher*innen innerhalb eines Spots oder die Kombination mit Musik und Soundbranding. Auch sei die fehlende Emotionalität eine Schwäche der Künstlichen Intelligenz. Emotionen sind gerade im Audiobereich wichtig, um „das Bild einer Marke in den Köpfen der Hörer und Hörerinnen zu erwecken“, sagt Siegmund.

Wo KI dagegen bereits heute sinnvolle Dienste leisten könne, sei die Informationsvermittlung und effiziente Kommunikation von Angeboten, etwa im Handel. Diese könnten national zum Beispiel Rabatte auf bestimmte Lebensmittel bewerben. Damit wären 80 Prozent eines Radiospots gleich. Die übrigen 20 Prozent könnten durch KI lokal angepasst werden, etwa durch die Nennung der jeweiligen Filiale, deren Adressen und Öffnungszeiten. Diese sogenannten regionalisierten Allongen ermöglichen eine individuellere Ansprache.

Das Einsprechen von Tippquoten für Spots von Sportwettenanbietern nennt Siegmund als weiteres Feld, in dem sich der Einsatz von KI anbietet. Geht es also um Personalisierung, Schnelligkeit und Skalierbarkeit einer Kampagne, liefert die KI-gestützte Kreation wertvolle Hilfe.

Noch offen ist die Diskussion in der Branche, wie mit der Kennzeichnungspflicht im Rahmen des AI Act umzugehen ist. Im Audiobereich könnte eine mögliche Lösung Siegmund zufolge ein KI-Jingle sein; vergleichbar mit einem Wasserzeichen auf KI-generierten Bildern. Vielleicht kann der KI Spot Creator auch dafür einen Vorschlag machen.