Deutsch: Was wird gebraucht
From SIMON
Damit simon Ihre Sprache erkennen kann und darauf reagiert, benötigen Sie ein "Sprachmodell".
Sprachmodelle beschreiben wie Ihre Stimme klingt, welche Wörter existieren, wie diese klingen sollen und welche Wortkombinationen ("Sätze" oder "Strukturen") existieren.
Ein Sprachmodell (engl.: "Speech model") besteht im Prinzip aus zwei Teilen:
- Sprachmodell (engl.: "Language model"): Beschreibt welche Wörter existieren und welche Sätze grammatikalisch korrekt sind
- Akustikmodell (engl.: "Acoustic model"): Beschreibt wie diese Wörter klingen sollen.
Sie benötigen beide Komponenten um simon zu ermöglichen Ihre Stimme zu erkennen.
Sprachmodell (eng.: Language model)
In den meisten Fällen werden Sie einfach das entsprechende Szenario für Ihren Anwendungsfall installieren um das komplette Sprachmodell aufzubauen.
Wenn Sie ihr eigenes Sprachmodell aufbauen wollen (zum Beispiel weil Ihr Anwendungsfall durch kein Szenario abgedeckt wird), können Sie simon verwenden um Wörter und Grammatikstrukturen hinzuzufügen / zu ändern / zu löschen.
Um das Hinzufügen von Wörtern leichter zu machen, können Sie ein Schattenlexikon importieren.
Akustikmodell (engl.: Acoustic model)
Um Ihr eigenes Akustikmodell zu generieren reicht es die Trainingstexte die mit Ihrem Szenario mitgeliefert werden sollten ein paar mal vorzulesen (trainieren).
Wenn Sie ein neues Szenario erstellen, können Sie Trainingstexte mit simon leicht selbst erstellen. Das simon Handbuch gibt hier mehr informationen.
Alternative können Sie ein statisches oder adaptiertes Basismodell verwenden um das HTK zu vermeiden oder um die Erkennungsrate zu erhöhen.