Open JTalk
「Open JTalk」は日本語の文章から日本語の音声を合成し、WAVファイルを生成するソフトウェアです。「端末」からコマンドで実行するため、少しハードルが高く感じるかもしれませんが、使い方はそれほど難しくありません。
辞書と音声データ
「Open JTalk」を利用するにあたり、辞書と音声データが必要になります。辞書
辞書とは、日本語の文章を形態素(≒品詞)に分解するためのデータです。(形態素解析)例えば、「今日の天気は晴れです。」は以下のように形態素に分解されます。
- 今日
- の
- 天気
- は
- 晴れ
- です
- 。
またそれぞれ分解された形態素に情報を付加します。
形要素 | 形要素の種類 | 読み |
---|---|---|
今日 | 名詞 | キョウ |
の | 助詞 | ノ |
天気 | 名詞 | テンキ |
は | 助詞 | ワ |
晴れ | 名詞 | ハレ |
です | 助動詞 | デス |
。 | 句点 |
上記に上げた付加される情報は一例で、実際は様々な情報が付加されます。
というわけで、この辞書がないと音声を生成できません。
音声を生成する方向性がこの辞書により決まります。
音声データ
辞書により形態素解析されたデータから、音声を生成するためのデータです。音声を生成するためのデータですから、男性の声や女性の声など使用する音声データにより声質が大きく変わります。
音声データがないと、音声を合成することができません。
Open JTalkをインストールする
Open JTalkをインストールします。「Ubuntuソフトウェアセンター」を起動し、「open-jtalk」で検索します。
「インストール」ボタンをクリックします。
アドオンについて
以下の2種類のアドオンが表示されます。いずれも「Open JTalk」を利用するのに必要なアドオンですので、すべてにチェックを入れ「変更を適用」ボタンをクリックしてください。
「Japanese male voice data for Open JTalk」は音声データです。
「NAIST Japanese Dictionary for Open JTalk」は辞書です。
Open JTalkのテストを行う
「Open JTalk」をインストールしたら、まず「Open JTalk」のテストを行います。1.コマンドの実行
「端末」を起動し、以下のコマンドを実行します。
echo 今日の天気は晴れです。 | open_jtalk -x /var/lib/mecab/dic/open-jtalk/naist-jdic -m /usr/share/hts-voice/nitech-jp-atr503-m001/nitech_jp_atr503_m001.htsvoice -ow ~/open_jtalk.wav
特に問題がなければ、以下のようにコマンドの実行結果は何も表示されません。
2.WAVファイルの確認
「Nautilus」を起動し、自分のホームフォルダーを開きます。以下のように「open_jtalk.wav」ファイルが作成されています。
「open_jtalk.wav」ファイルをダブルクリックして開きます。
3.WAVファイルの再生
「Totem」が起動し、WAVファイルが再生されます。「今日の天気は晴れです」と音声が流れればOKです。