open_jtalkコマンドの説明
前回テストを行う際、「open_jtalk」コマンドの説明は省略しました。ここではコマンドの使い方を見ていきます。
コマンドのフォーマット
コマンドのフォーマットは以下のようになります。open_jtalk <オプション> <テキストファイル>
辞書と音声データのオプション
辞書と音声データに関するオプションです。これらのオプションは必須です。
-x (辞書の指定)
辞書があるフォルダーのパスを指定します。辞書は複数のファイルから構成されるため、辞書そのものではなく辞書があるフォルダーを指定してください。
オプションの記述例
-x /var/lib/mecab/dic/open-jtalk/naist-jdic-m (音声データの指定)
音声データを指定します。こちらは辞書と異なり、音声データ(ファイル)を指定します。
オプションの記述例
-m /usr/share/hts-voice/nitech-jp-atr503-m001/nitech_jp_atr503_m001.htsvoice出力するファイルに関するオプション
出力するファイルに関するオプションです。-ow (WAVファイルの指定)
音声に変換したデータを保存するWAVファイルを指定します。必須のオプションです。
オプションの記述例
-ow ~/open_jtalk.wav-ot (ログファイルの指定)
形態素解析の結果など、音声に変換するにあたり使用した様々な情報を出力します。オプションの記述例
-ot ~/open_jtalk.log音声データの生成に関するオプション
音声データの生成に関するオプションです。話す速度やサンプリング周波数などの指定が可能です。
これらのオプションは省略できます。
オプションを省略した場合、デフォルト値が使用されます。
-s (サンプリング周波数)
音声のサンプリング周波数を指定します。1以上の整数値を指定します。
デフォルト値は自動的に決定されます。
オプションの記述例
-s 48000-p (フレーム周期)
フレーム周期を指定します。1以上の整数値を指定します。
デフォルト値は自動的に決定されます。
オプションの記述例
-p 240-a (オールパス値)
ポストフィルター係数を指定します。指定できる値は、0.0 ~ 1.0です。
デフォルト値は自動的に決定されます。
オプションの記述例
-a 0.5-b (ポストフィルター係数)
ポストフィルター係数を指定します。指定できる値は、0.0 ~ 1.0です。
デフォルト値は0.0です。
オプションの記述例
-b 0.2-r (スピーチ速度係数)
話す速さ(係数)を指定します。指定できる値は、0.0以上の数値を指定します。
デフォルト値は1.0です。
オプションの記述例
-r 1.2-fm (追加ハーフトーン)
追加ハーフトーンの値を指定します。小数で指定します。
デフォルト値は0.0です。
オプションの記述例
-fm 0.5-u (有声/無声境界値)
有声/無声境界値(MSD境界値)を指定します。指定できる値は、0.0 ~ 1.0です。
デフォルト値は0.5です。
オプションの記述例
-u 0.4-jm (スペクトラム系列内変動の重み)
スペクトラム系列内変動の重みを指定します。指定できる値は、0.0以上の値です。
デフォルト値は1.0です。
オプションの記述例
-jm 1.2-jf (F0系列内変動の重み)
F0系列内変動の重みを指定します。指定できる値は、0.0以上の値です。
デフォルト値は1.0です。
オプションの記述例
-jf 1.2-z (オーディオバッファサイズ)
オーディオバッファサイズを指定します。0以上の値を指定します。
デフォルト値は0です。
オプションの記述例
-z 100テキストファイル
音声に変換する日本語のテキストファイルを指定します。これを省略した場合は、標準入力から日本語のテキストを読み込みます。