Pepper NAO Choregraphe Naoqi wiki - ALTextToSpeech

このページについて

NAOqi Audio - 概要 | API | チュートリアル




利用

ALTextToSpeechモジュールはロボットをしゃべらすことが可能です。音声合成エンジンにコマンドを送信し、音声変更の権限を与えます。音声合成の結果はロボットのスピーカーへ送信されます。

カスタマイズ

ALMemoryは名前のついた値を格納することもでき、イベントを通知するハブとしてもふるまいます。

動作

言語エンジン
ALTextToSpeechは言語合成機あるいは言語エンジンに基づいてます。

選択した言語によって特定のエンジンが使われます:
PepperNAO
JapanesemicroAITalk engine, provided by AI, Inc.microAITalk engine, provided by AI, Inc.
Other languagesNUANCEACAPELA
備考:使用されているエンジンはパッケージの説明に明記されています。

カスタマイズ

・パラメータを使う
出力音声の流れは変更することが可能です。

例えば以下のような効果があります。


pitch shift effectは声のピッチの初期値を変更し、
double voice effectは軸となる声に遅延とエコー効果を付加します。
microAITalkエンジンにはさらなるパラメータが用意されています。


より詳しくはこちらを参照してください:ALTextToSpeechProxy::setParameter


・タグを使う
ロボットをしゃべらせる際に複数の表現を加えたい場合、テキストにタグを使用することを強くおすすめします。文章の途中であってもタグは、ピッチ、声のはやさや抑揚、文字の量を変更したり、文字間に間を加えたりすることが可能です。

より詳しくはこちらを参照してください。:Using tags for voice tuning.

実行する

ALTextToSpeechを実行する最も簡単な方法はChoregraphでSay Boxを利用することです。


実機あるいはバーチャルロボットで試す
ACAPELA、microAITalk、Nuance エンジンは実機のみで実行できます。

バーチャルロボットを使う場合、読まれるテキストはChoregraphのロボットビューあるいはダイアログパネルに現れます。