Pepper やNaoで使用されているNaoqi OSのメモです。

このページについて


NAOqi Audio - 概要 | API | チュートリアル

バーチャルロボットではテストできません。-このモジュールは実際のロボットのみで使用できます。

利用


ALSpeechRecognitionモジュールは、あらかじめ定義された単語やフレーズを複数の言語で認識する機能をロボットに提供します。

言語の完全なリストについては、nao"サポートされている言語", pepper"サポートされている言語"を参照してください。

方法


技術
ALSpeechRecognitionNUANCEによって提供される洗練された音声認識技術に依存しています。

動作原理
ステップ説明
A開始する前に、ALSpeechRecognitionは、認識してほしいフレーズのリストを与える必要があります。
B開始されると、ALSpeechRecognitionはSpeechDetectedというキーを配置します。これは、話者が現在聞かれているかどうかを指定するブール値です。
C話者が聞かれた場合、ロボットが聞いたものと最も一致するリストの要素をWordRecognizedキーの中に置きます。
D話者が聞かれた場合、ロボットが聞いたものと最も一致するリストの要素をWordRecognizedAndGrammarのキーの中に置きます。

WordRecognizedキーは、次のように構成されています。:
 [phrase_1, confidence_1, phrase_2, confidence_2, ..., phrase_n, confidence_n]
ここで:
phrase_iはあらかじめ定義されたフレーズの1つであり、
confidence_iは、このフレーズが実際に人間の話者によって発音された確率の推定値です。
そのキーに含まれる異なる仮説は、最も可能性が高いフレーズが最初に来るように順序付けられていることに注意してください。

WordRecognizedAndGrammarキーは、次のように構成されています。:
 [phrase_1, confidence_1, grammar_1, phrase_2, confidence_2, grammar_2, ..., phrase_n, confidence_n, grammar_n]
ここで:
phrase_iはあらかじめ定義されたフレーズの1つであり、
confidence_iは、このフレーズが実際に人間の話者によって発音された確率の推定値です。
grammar_i は、認識エンジンによって使用される文法の名前です。
そのキーに含まれる異なる仮説は、最も可能性が高いフレーズが最初に来るように順序付けられていることに注意してください。

Word Spotting オプション


ALSpeechRecognitionProxy::setVocabulary のパラメータ、enableWordSpottingは返された結果の内容を変更します。:

・trueの場合:Phrase_iには<...> phrase <...>が含まれます。マーカー...は音声認識のゴミの結果を示します。
・falseの場合:Phrase_iには正確に検索された語句が含まれます。

入門


Choregrapheを使って音声認識の基本機能を発見するには、チュートリアルを参照してください。:
音声認識のテスト.

コメントをかく


「http://」を含む投稿は禁止されています。

利用規約をご確認のうえご記入下さい

Menu

NAOqi - Developer guide

Creating an application?

Programming for a living robot?

Other tutorials?

Choregraphe Suite?

どなたでも編集できます