最終更新:ID:HukTMs0QQA 2017年02月19日(日) 15:33:06履歴
NAOqi Audio - 概要 | API | チュートリアル
バーチャルロボットではテストできません。-このモジュールは実際のロボットのみで使用できます。
ALSpeechRecognitionモジュールは、あらかじめ定義された単語やフレーズを複数の言語で認識する機能をロボットに提供します。
言語の完全なリストについては、nao"サポートされている言語", pepper"サポートされている言語"を参照してください。
技術
ALSpeechRecognitionはNUANCEによって提供される洗練された音声認識技術に依存しています。
動作原理
ステップ | 説明 |
A | 開始する前に、ALSpeechRecognitionは、認識してほしいフレーズのリストを与える必要があります。 |
B | 開始されると、ALSpeechRecognitionはSpeechDetectedというキーを配置します。これは、話者が現在聞かれているかどうかを指定するブール値です。 |
C | 話者が聞かれた場合、ロボットが聞いたものと最も一致するリストの要素をWordRecognizedキーの中に置きます。 |
D | 話者が聞かれた場合、ロボットが聞いたものと最も一致するリストの要素をWordRecognizedAndGrammarのキーの中に置きます。 |
WordRecognizedキーは、次のように構成されています。:
[phrase_1, confidence_1, phrase_2, confidence_2, ..., phrase_n, confidence_n]ここで:
・phrase_iはあらかじめ定義されたフレーズの1つであり、
・confidence_iは、このフレーズが実際に人間の話者によって発音された確率の推定値です。
そのキーに含まれる異なる仮説は、最も可能性が高いフレーズが最初に来るように順序付けられていることに注意してください。
WordRecognizedAndGrammarキーは、次のように構成されています。:
[phrase_1, confidence_1, grammar_1, phrase_2, confidence_2, grammar_2, ..., phrase_n, confidence_n, grammar_n]ここで:
・phrase_iはあらかじめ定義されたフレーズの1つであり、
・confidence_iは、このフレーズが実際に人間の話者によって発音された確率の推定値です。
・grammar_i は、認識エンジンによって使用される文法の名前です。
そのキーに含まれる異なる仮説は、最も可能性が高いフレーズが最初に来るように順序付けられていることに注意してください。
ALSpeechRecognitionProxy::setVocabulary のパラメータ、enableWordSpottingは返された結果の内容を変更します。:
・trueの場合:Phrase_iには<...> phrase <...>が含まれます。マーカー...は音声認識のゴミの結果を示します。
・falseの場合:Phrase_iには正確に検索された語句が含まれます。
コメントをかく