16.09.2013 Aufrufe

Das Leben könnte viel einfacher sein

Das Leben könnte viel einfacher sein

Das Leben könnte viel einfacher sein

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

Frankfurter Allgemeine Zeitung<br />

Seite B 6/ Montag, 21. Oktober 1996, Nr. 245<br />

Beitrag zur Messe Systems 1996<br />

Computer hört aufs Wort<br />

Automatische Spracherkennung / Von Andreas Wendemuth<br />

<strong>Das</strong> <strong>Leben</strong> <strong>könnte</strong> <strong>viel</strong> <strong>einfacher</strong> <strong>sein</strong>, wenn wir die Dinge ganz einfach beim Namen nennen<br />

<strong>könnte</strong>n. Man müßte einfach sagen, was man will - und es geschieht. Natürlich zu einem günstigen<br />

Preis, ohne <strong>viel</strong> Personal, verläßlich, schnell und zu jeder Tageszeit. Womöglich auch noch in einer<br />

Fremdsprache und vor dem Geräuschhintergrund einer Bahnhofshalle. Ein gordischer Knoten?<br />

Nicht das Schwert, sondern der Kollege Computer hilft aus dem Dilemma. Spracherkennung heißt<br />

die neue Technologie, mit der gesprochene Wörter automatisch in Kommandos oder geschriebene<br />

Texte verwandelt werden. Sprachverstehen ist ebenfalls mit dem Computer möglich: Aus<br />

gesprochenen Äußerungen wird der eigentliche Frageinhalt isoliert. Die letzte Stufe ist der Dialog<br />

mit der Maschine: Fehlende Angaben werden vom Computer nachgefragt. und mit Hilfe von<br />

Datenbanken wird die Anfrage beantwortet.<br />

Nun wollen die Benutzer nicht nur auf Verlangen des Computers einzelne Worte sagen (Interactive<br />

Voice Response. IVR). Automatische Spracherkennung soll so natürlich wie möglich und immer<br />

dann einsetzbar <strong>sein</strong>, wenn der Benutzer es wünscht. Was haben mehr als zwei Jahrzehnte<br />

internationaler Forschung und Entwicklung an verwertbaren Produkten hervorgebracht?<br />

Vom Diktat zum Dialog<br />

<strong>Das</strong> Erkennen ganzer Sätze ist die große Herausforderung für automatische Diktiersysteme. Zur<br />

Zeit sind diese noch eingeschränkt auf bestimmte Korrespondenzen, etwa von Rechtsanwälten oder<br />

Radiologen. Diese Berufsgruppen können während der Diktate 64 000 Wortformen verwenden.<br />

Spracherkennungssysteme mit diesem großen Vokabular sind noch sprecherabhängig.. <strong>Das</strong> System<br />

muß zunächst vom Benutzer trainiert werden. Es schreibt direkt in ein gängiges<br />

Textverarbeitungssystem, in dem Korrektur und Nachbearbeitung wie gewohnt möglich sind.<br />

Anbieter wie IBM und Dragon brachten bereits frühzeitig Produkte auf den Markt, die den<br />

diktierten Text in isolierten Worten erkennen. Der Anwender muß dabei nach jedem Wort eine<br />

künstliche Sprechpause einlegen: ein gewöhnungsbedürftiges und daher wenig akzeptiertes<br />

Verfahren. Die ersten pausenfreien Diktate ermöglichte das Diktiersystem SP6000 von Philips.<br />

IBM und Siemens folgen jetzt mit ähnlichen Entwicklungen. Wissenswertes dazu findet sich unter<br />

http://www.speech.be.philips.com. Diese Systeme machen bei Eigennamen (die sie nicht kennen<br />

können) oder unterdrückten Wortendungen unvermeidbare Fehler, typischerweise nur wenige<br />

Prozent des Textes. Inklusive deren Korrektur erspart das automatische System am Ende<br />

mindestens ein Drittel der Zeit für herkömmliches Diktieren.<br />

Technisch <strong>einfacher</strong>, aber in Produkten erst jetzt <strong>viel</strong>fältig verfügbar ist die Kommandoeingabe für<br />

Steuerungszwecke. <strong>Das</strong> dazu notwendige Spracherkennungssystem ist sprecherunabhängig, kennt


ein kleines, aber ausreichendes Vokabular von zehn bis 100 Wörtern und kann ausschließlich<br />

isoliert gesprochene Wörter verarbeiten. Der Einsatz solcher Systeme ist nicht nur am Telefon<br />

möglich: Will der Autofahrer <strong>sein</strong>en Lieblingssender im Autoradio einstellen, muß er nicht mehr<br />

die Hand vom Steuer nehmen. <strong>Das</strong> Radio reagiert bereits auf Zuruf. Will er telefonieren, ruft er den<br />

Namen des gewünschten Gesprächspartners in das Telefon ("name dialling"). Auch an der PC-<br />

Welt geht diese Entwicklung nicht vorüber. In Produkten von Apple und Microsoft kann sich der<br />

Anwender bereits heute per Sprachkommando durch die Menüs der PC-Oberflächen bewegen<br />

("Command & Control").<br />

Der Dialog mit der Maschine ist die bisher letzte Stufe in der Entwicklung automatischer<br />

Sprachverarbeitung. Produkte wie der "Sprechende Fahrplan" der SBB (Schweizerische<br />

Bundesbahn. Tel. 00411 1 57 02 22) oder Prototypen wie die automatische Auskunft über deutsche<br />

Bahnverbindungen (Tel. 02 41 1 60 40 20) haben den aktuellen Fahrplan gespeichert. Der Anrufer<br />

kann völlig frei mit dem Computer sprechen: Er kann <strong>sein</strong>e eigenen Worte wählen - auch Akzente<br />

(nicht Dialekte) werden akzeptiert. Er kann den Gesprächsverlauf selbst bestimmen, muß dabei<br />

aber <strong>sein</strong> Anliegen tatsächlich vorbringen und kooperativ auf Fragen der Maschine antworten.<br />

Diese werden bei fehlenden Angaben des Anrufers (zum Beispiel Abfahrtsort) so lange gestellt, bis<br />

der Reiseablauf vervollständigt ist.<br />

Moderne Spracherkennung macht’s möglich: Der sprechende Fahrplan<br />

gibt dem Anrufer Auskunft über die gewünschten Zugverbindungen.<br />

Intelligente Integration<br />

Auskunfts- und Vermittlungssysteme laufen heute auf dem PC und sind flexibel einsetzbar: als<br />

Zusatzoption, als Entlastung in Spitzenzeiten (.fall-back"), als paralleles System zu einem Operator<br />

oder als ausschließliches System für Standardanfragen oder für den Nachtbetrieb.<br />

Um hochwertige Spracherkennungssysteme tatsächlich zum Einsatz zu bringen, fehlt gegenwärtig<br />

in <strong>viel</strong>en Fällen noch ein wichtiger Schritt: die durchdachte Integration der<br />

Spracherkennungstechnologie in bestehende Arbeitsabläufe. Ein Kommandosystem, etwa die<br />

Namenswahl beim Telefon, muß von dem Signalprozessor des Telefons oder Handys bedient<br />

werden. Ein natürlichsprachiges Diktiersystem sollte in der bestehenden PC-Umgebung des<br />

Sekretariats oder in Krankenhausinformationssystemen eingesetzt werden können. Wer ein<br />

professionelles Dialogsystem anbietet, muß es in die Telefonumgebung des Kunden integrieren und<br />

eventuell mit vorhandenen Diensten kombinieren. In öffentlichen Netzen und Call Centers müssen


solche Dienste daher definierte Schnittstellen haben. Dann können sie mit Hilfe spezieller<br />

Plattformen einfach integriert werden.<br />

Automatische Sprachverarbeitung macht in <strong>viel</strong>en Bereichen eine Kostenersparnis oder<br />

Kapazitätserhöhung erst möglich (Auskunftssysteme), in anderen Bereichen wird sie zusätzlich zu<br />

bestehenden Möglichkeiten eingesetzt (Eingabe per Spracherkennung oder Tastatur).<br />

Sprachverarbeitung wird sich immer weitere Anwendungsfelder erschließen und dabei eine<br />

ähnliche Entwicklung nehmen wie PC-Oberflächen oder Textverarbeitungsprogramme: in der<br />

Kindheit holperig, aber rasch fortschreitend, im Erwachsenenalter ausgereift, aber weiter lernfähig,<br />

nach einigen Generationen nicht mehr wegzudenken.

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!