Spracherkennungs-Software liest zehn Sätze pro Sekunde

Die Firma Mediasuccess GmbH hat eine Spracherkennung entwickelt, die Worte intelligent verarbeitet, komplexe Fragen beantwortet und so die Kommunikation zwischen Mensch und Maschine ermöglicht. Mehr als drei Jahre Entwicklungsarbeit sind hineingeflossen. Herausgekommen ist eine „ihmac“ genannte Software (intelligent humane machine communication). Sie kann in deutscher Sprache Fragen beantworten.

Um das zu erreichen, wird „ihmac“ in einem natürlichen Lernprozess „Wissen eingehaucht“. Das Programm lernt wie ein Mensch. Man füttert es mit Wissen, formuliert in deutscher Sprache. So kann die Software ihr Wissen zum Beispiel aus Büchern, Bedienungsanleitungen oder dem Internet gewinnen. Darüber hinaus kann das Programm, genauso wie der Mensch, dieses Wissen wirkungsvoll einsetzen, indem es kausale Zusammenhänge wie „wenn …, dann …“-Regeln berücksichtigt und Verallgemeinerungen anwendet. Diese „Intelligenz“ erliest sich „ihmac“ ebenfalls aus dem Inhalt. Sie erkennt selbständig, ob es sich um einen „normalen“ Aussagesatz handelt, oder ob es eine allgemeine Regel ist und verarbeitet es dementsprechend.

Eine Antwort statt hunderte Suchergebnis-Seiten

Wenn die Software eine Regel liest wie: „Jemand fährt von einem Ort A nach Ort B, wenn Jemand von einem Ort A nach Ort C und von Ort C nach Ort B fährt“, kann sie diese Regel zum Beispiel auf alle existierenden Zugverbindungen anwenden und die Frage, ob eine Zugverbindung von Klagenfurt nach Erfurt existiert, korrekt beantworten.

Die Anwendungsmöglichkeiten der Software sind vielseitig. So kann sie als mobile App eingesetzt werden, um Fragen nach Bedienungsdetails eines Autoradios zu beantworten. Statt in endlosen Bedienungsanleitungen zu blättern, bekommt der Anwender seine Fragen auf den Punkt beantwortet: „Wie wechsle ich den Sender?“ – Die „ihmac“-Antwort: „Bitte die Taste FM drücken.“

Ein weiteres Beispiel: Auf einer Webseite erhalten Besucher umfassende Produktberatungen: „Welche Staude blüht im Mai rot und wächst in der Sonne?“ – „ihmac“-Antwort: „Türkischer Mohn.“ Als Suchmaschine liefert das Programm eine Antwort statt hunderte von Suchergebnisseiten: „Wie viele Kinder hatte Friedrich der Große?“ – ihmac: „17 Kinder.“

Antworten durch Bilder und Videos ergänzen

Die Software steht jedoch nicht nur ratsuchenden Garten- oder Geschichtsliebhabern mit Informationen zur Verfügung, sie kann als „Experten-System“ in jedem anderen Fachbereich eingesetzt werden. Das Wissen durch das Einlesen einfacher Textdokumente aufzubauen, ist einer der wesentlichen Vorteile beim Einsatz der Software. Über eine spezielle Administrator-Oberfläche können die Anwender neue Texte oder Sätze einlesen und damit dem Programm neues Wissen vermitteln.

Auch im Bereich des Service kann diese Art der intelligenten Online-Kommunikation zur Entlastung zahlreicher Hotlines beitragen. Statt viel Zeit in Warteschleifen zu verbringen, kommuniziert der Kunde mit dem Online-Assistenten. Mittels intelligenter Dialogführung gelangt der Kunde schnell zu der gewünschten Information. Antworten des Online-Assistenten können multimedial durch Bilder oder Videos ergänzt werden.

Die Qualität der Spracherkennung ist sehr hoch. Der Grundwortschatz übersteigt schon in vielen Bereichen den des Dudens, und dabei ist die Software sehr schnell, sie kann circa zehn Sätze pro Sekunde lesen, das sind etwa 35.000 Sätze beziehungsweise 1.000 DIN A4-Seiten pro Stunde. Dialoge mit mehreren Kunden gleichzeitig sind möglich. In der Datenbank kann der Inhalt von Millionen von Seiten gespeichert werden.

(MediaSuccess GmbH/asc)