ALSpeechRecognition

このページについて

NAOqi Audio - 概要 | API | チュートリアル

バーチャルロボットではテストできません。-このモジュールは実際のロボットのみで使用できます。

利用

ALSpeechRecognitionモジュールは、あらかじめ定義された単語やフレーズを複数の言語で認識する機能をロボットに提供します。

言語の完全なリストについては、nao"サポートされている言語", pepper"サポートされている言語"を参照してください。

方法

技術
ALSpeechRecognitionはNUANCEによって提供される洗練された音声認識技術に依存しています。

動作原理

ステップ	説明
A	開始する前に、ALSpeechRecognitionは、認識してほしいフレーズのリストを与える必要があります。
B	開始されると、ALSpeechRecognitionはSpeechDetectedというキーを配置します。これは、話者が現在聞かれているかどうかを指定するブール値です。
C	話者が聞かれた場合、ロボットが聞いたものと最も一致するリストの要素をWordRecognizedキーの中に置きます。
D	話者が聞かれた場合、ロボットが聞いたものと最も一致するリストの要素をWordRecognizedAndGrammarのキーの中に置きます。

WordRecognizedキーは、次のように構成されています。:

　[phrase_1, confidence_1, phrase_2, confidence_2, ..., phrase_n, confidence_n]

ここで:
・phrase_iはあらかじめ定義されたフレーズの1つであり、
・confidence_iは、このフレーズが実際に人間の話者によって発音された確率の推定値です。
そのキーに含まれる異なる仮説は、最も可能性が高いフレーズが最初に来るように順序付けられていることに注意してください。

WordRecognizedAndGrammarキーは、次のように構成されています。:

　[phrase_1, confidence_1, grammar_1, phrase_2, confidence_2, grammar_2, ..., phrase_n, confidence_n, grammar_n]

ここで:
・phrase_iはあらかじめ定義されたフレーズの1つであり、
・confidence_iは、このフレーズが実際に人間の話者によって発音された確率の推定値です。
・grammar_i は、認識エンジンによって使用される文法の名前です。
そのキーに含まれる異なる仮説は、最も可能性が高いフレーズが最初に来るように順序付けられていることに注意してください。

Word Spotting オプション

ALSpeechRecognitionProxy::setVocabulary のパラメータ、enableWordSpottingは返された結果の内容を変更します。:

・trueの場合:Phrase_iには<...> phrase <...>が含まれます。マーカー...は音声認識のゴミの結果を示します。
・falseの場合:Phrase_iには正確に検索された語句が含まれます。

入門

Choregrapheを使って音声認識の基本機能を発見するには、チュートリアルを参照してください。:
音声認識のテスト.

このページを編集するこのページを元に新規ページを作成

印刷する

コメント（0）

ALSpeechRecognition - Pepper NAO Choregraphe Naoqi wiki 先頭へ

コメントをかく

名前	ユーザIDを使用しないで書き込む	ユーザーIDを使う	ログインする
画像コード	画像に記載されている文字を下のフォームに入力してください。
備考	「http://」を含む投稿は禁止されています。
本文
利用規約をご確認のうえご記入下さい

Pepper NAO Choregraphe Naoqi wiki

利用

方法

Word Spotting オプション

入門

コメントをかく

Menu

メニュー

NAOqi - Developer guide

その他

最近更新したページ

2023-01-28

2022-05-09

2022-04-10

2022-03-13

2021-02-21

2020-12-20

2020-12-19

2017-05-31

2017-04-03

2017-04-02

2017-04-01

2017-03-24

2017-03-05

最新コメント

2021-08-02

QRコード

アクセス解析中