ASKA SmartVoice
Spracherkennung für die Datenerfassung, Steuerung von
Applikationen und Systemen in Qualitätssicherung, Logistik,
Labordatenerfassung, Produktion und vielen Einsatzgebieten
mehr.
ASKA SmartVoice integriert die besten derzeit am Markt erhältlichen
Spracherkennungs-systeme, die speziell für diesen Einsatz
entwickelt wurden (z.B.
ScanSoft VoCon3200). Im Gegensatz
zu den Lösungen, die für die Erstellung von Diktaten entwickelt
wurden (Dragon NaturallySpeaking, IBM ViaVoice), arbeiten
diese Erkenner zumeist sprecherunabhängig, d.h. es ist kein
Training der Benutzer notwendig. Gerade bei Einsatzgebieten,
in denen der Sprecher öfters wechselt, ist dies ein entscheidender
Vorteil.
Die zu erkennenden Wörter werden werden vorab definiert oder
während der Laufzeit des Programms dynamisch (z.B. durch Datenbankabfragen
oder hinterlegten Listen) erstellt. Dadurch sind nur solche
Wörter im Vokabular aktiv, die auch erkannt werden sollen.
Damit wird eine sehr hohe Erkennungsgenauigkeit sichergestellt.
Durch die Möglichkeit der genauen Parametrisierung kann das
Erkennungsverhalten an das jeweilige Einsatzgebiet optimal
angepasst werden. Beispiel: In der Retourenerfassung des Schwab
Versands, wo unsere Lösung eingesetzt wird, gibt es durch
die Förderbänder ein relativ lautes Hintergrundgeräusch. Ein
spezieller Parameter kann so eingestellt werden, dass die
Spracherkennung nur dann mit der Erkennung beginnt, wenn der
Sprecher spricht, da dann dieser Wert (Hintergrund) überschritten
wird. Dadurch kann der Erkenner unterscheiden, wann tatsächlich
Sprache über das Mikrofon aufgenommen wird.
Zu jedem einzelnen Wort bzw. jeder einzelnen Äußerung, die
im Vokabular definiert wird, kann einzeln bestimmt werden,
was im Falle einer Erkennung geschehen soll. Folgende Möglichkeiten
stehen zur Verfügung:
- Übergabe des erkannten Wortes an Zielapplikation
- Übergabe einer beliebigen Tastaturfolge inkl. Sondertasten
an Zielapplikation
- Übergabe einer Kombination aus Zeichen- und Tastaturfolge
an Zielapplikation
- Ausführen eines Skriptes mit der Abfolge mehrer Anweisungen
- Ausführen eines SQL Kommandos in eine Datenbank (Access,
SQL Server, Oracle etc)
weitere Funktionsmerkmale:
- sprecherunabhängiges Spracherkennungssystem (Einzelworttraining
möglich)
- Vokabularwechsel zur Laufzeit, z.B. bei Fensterwechsel
in Zielapplikation
- geringer Ressourcenverbrauch des Erkenners (ab 300 MHz
CPU)
- eigene Wörterbücher mit speziellen Aussprachevarianten
möglich
- unempfindlich gegen hohen Hintergrundgeräuschpegel
|