Mobile Webdienste brechen sich bald Bahn

Theo Lutz, Schüler des legendären Kybernetikers Max Bense, erarbeitete als technischer Chefredakteur zum 70jährigen Firmenjubiläum von IBM eine bemerkenswerte Studie. Laut Gunnar Sohn, Chefredakteur des Online-Nachrichtendienstes „Neue Nachricht“, versucht Lutz, mit „Zehn mal 2010“ die IBM-Version vom Computing im Jahre 2010 zu erklären.

Wichtige Hilfsmittel seien für ihn das Moore’sche Gesetz von der ständig wachsenden Prozessorleistung und Einsichten in die Forschung von IBM gewesen, etwa im Bereich der Glasfasertechnik. Interessant sei die fünfte These. Darin prognostiziere Lutz beispielsweise, dass der Mensch mit dem Computer „umgangssprachlich“ in Schrift und Stimme kommunizieren wird. Technisch sei man mittlerweile soweit, die Mensch-Maschine-Kommunikation in normaler Sprache zu ermöglichen. Der Google-Forschungsdirektor Peter Norvig soll sogar davon überzeugt sein, dass in einigen Jahren die Mehrheit der Nachrichten im Web nicht mehr getippt, sondern per Sprache gesteuert werde.

Multimodale Systeme, also Anwendungen, die sich über Sprache, Gesten oder Tastatur bedienen lassen, hätten nach Einschätzung der Firma Telenet ein Marktpotenzial, das bislang nur in Ansätzen ausgeschöpft wird. Das wolle der Spezialist für Sprachdialogsysteme ändern, weshalb er gemeinsam mit Semvox eine Mobilfunkapplikation für die Veranstaltungssuche konzipiert habe. Durch die Einbindung von Services wie Google Maps, Youtube oder Google Calendar seien neben den Suchergebnissen auch Videos und weitere Informationen zu bekommen. „Die Sprache als Steuerungsmedium für komplexe Eingaben bei mobilen Endgeräten einzusetzen, ist naheliegend. Die kleinen Tastaturen und Bildschirme erschweren die Nutzung der Webdienste auf dem Handy“, lässt sich Dr. Florian Hilger als Leiter Innovation bei Telenet zitieren. Automatische Sprachverarbeitung beschränke sich aber nicht nur auf das Erkennen von Kommandos oder das Diktieren. Sie kann laut Hilger auch zur automatischen Verschriftung von Sprachnachrichten genutzt werden und so die Grenze zwischen E-Mail und Voice-Mails auflösen.

Zudem werde die automatische Verifikation des Sprechers an Bedeutung gewinnen, wenn Banktransaktionen und andere Serviceleistungen zunehmend mobil durchgeführt werden. Wer Textnachrichten auf dem Handy verfassen wolle, müsse immer noch viele Beschränkungen hinnehmen. „Am Format der Endgeräte wird sich nicht viel ändern. Die Tastatur in unterschiedlichen Variationen ist für viele Menschen einfach zu klein. Sprachsteuerung wird sich hier über kurz oder lang durchsetzen, nicht nur beim Schreiben von Kurznachrichten, sondern auch bei Suchfunktionen“, erläutert der After Sales-Experte Peter Weilmuenster, Vorstandschef von Bitronic.

Manfred Pinkal, Professor am Institut für Computerlinguistik und Phonetik an der Universität des Saarlandes, sehe vielfältige Einsatzmöglichkeiten „in allen Anwendungsfällen, in denen die Benutzung anderer Ein-Ausgabe-Wege unmöglich oder lästig ist. Dazu gehört natürlich das Feld der Telefonie-Anwendungen. Da ist die kommerzielle Umsetzung am weitesten fortgeschritten.“ Nützlich sei die Sprachsteuerung zudem in Fällen, in denen Hände und Augen für andere Aufgaben gebraucht werden, beispielsweise bei operierenden Chirurgen, die Spiegel und Beleuchtung nachsteuern möchten. Der wirtschaftlich derzeit mit Abstand attraktivste Anwendungsfall sei der Sprachdialog im Auto: Navigation, Telefon und Radio, mitgebrachte Elektronikgeräte wie iPod oder Organizer und Zugriffsmöglichkeiten auf externe Informationsdienste und Internet würden dem Fahrer erlauben, seine Zeit im Auto für immer reichhaltigere Infotainment-Angebote zu nutzen. Da die Hände aber zum Steuern gebraucht würden, habe Sprache der Prognose des Wissenschaftlers zufolge hier eine echte Chance und durchschlagende Funktion.

Spannend sei nach Auffassung von Nuance-Generalmanager Michael-Maria Bommer alles, was sich unter der Überschrift „Connected Services“ für Autos abspiele: „So bekommt mein PKW in Zukunft eine SIM-Karte, mit der ich unterschiedliche Webdienste abrufen kann: Musikwünsche, aktuelle Stauwarnungen, Navigation, Ortung eines gestohlenen Fahrzeugs oder Geschwindigkeitsalarm.“

www.ne-na.de