ASKA SmartVoice

Spracherkennung für die Datenerfassung, Steuerung von Applikationen und Systemen in Qualitätssicherung, Logistik, Labordatenerfassung, Produktion und vielen Einsatzgebieten mehr.

 

ASKA SmartVoice integriert die besten derzeit am Markt erhältlichen Spracherkennungs-systeme, die speziell für diesen Einsatz entwickelt wurden (z.B. ScanSoft VoCon3200). Im Gegensatz zu den Lösungen, die für die Erstellung von Diktaten entwickelt wurden (Dragon NaturallySpeaking, IBM ViaVoice), arbeiten diese Erkenner zumeist sprecherunabhängig, d.h. es ist kein Training der Benutzer notwendig. Gerade bei Einsatzgebieten, in denen der Sprecher öfters wechselt, ist dies ein entscheidender Vorteil.

Die zu erkennenden Wörter werden werden vorab definiert oder während der Laufzeit des Programms dynamisch (z.B. durch Datenbankabfragen oder hinterlegten Listen) erstellt. Dadurch sind nur solche Wörter im Vokabular aktiv, die auch erkannt werden sollen. Damit wird eine sehr hohe Erkennungsgenauigkeit sichergestellt.

Durch die Möglichkeit der genauen Parametrisierung kann das Erkennungsverhalten an das jeweilige Einsatzgebiet optimal angepasst werden. Beispiel: In der Retourenerfassung des Schwab Versands, wo unsere Lösung eingesetzt wird, gibt es durch die Förderbänder ein relativ lautes Hintergrundgeräusch. Ein spezieller Parameter kann so eingestellt werden, dass die Spracherkennung nur dann mit der Erkennung beginnt, wenn der Sprecher spricht, da dann dieser Wert (Hintergrund) überschritten wird. Dadurch kann der Erkenner unterscheiden, wann tatsächlich Sprache über das Mikrofon aufgenommen wird.

Zu jedem einzelnen Wort bzw. jeder einzelnen Äußerung, die im Vokabular definiert wird, kann einzeln bestimmt werden, was im Falle einer Erkennung geschehen soll. Folgende Möglichkeiten stehen zur Verfügung:

 

- Übergabe des erkannten Wortes an Zielapplikation
- Übergabe einer beliebigen Tastaturfolge inkl. Sondertasten an Zielapplikation
- Übergabe einer Kombination aus Zeichen- und Tastaturfolge an Zielapplikation
- Ausführen eines Skriptes mit der Abfolge mehrer Anweisungen
- Ausführen eines SQL Kommandos in eine Datenbank (Access, SQL Server, Oracle etc)

 

weitere Funktionsmerkmale:

  • sprecherunabhängiges Spracherkennungssystem (Einzelworttraining möglich)
  • Vokabularwechsel zur Laufzeit, z.B. bei Fensterwechsel in Zielapplikation
  • geringer Ressourcenverbrauch des Erkenners (ab 300 MHz CPU)
  • eigene Wörterbücher mit speziellen Aussprachevarianten möglich
  • unempfindlich gegen hohen Hintergrundgeräuschpegel