kledgeb UbuntuやLinuxの最新情報を紹介

Open JTalk

  「Open JTalk」は日本語の文章から日本語の音声を合成し、WAVファイルを生成するソフトウェアです。


  「端末」からコマンドで実行するため、少しハードルが高く感じるかもしれませんが、使い方はそれほど難しくありません。

辞書と音声データ

  「Open JTalk」を利用するにあたり、辞書と音声データが必要になります。

  辞書

    辞書とは、日本語の文章を形態素(≒品詞)に分解するためのデータです。(形態素解析)
    例えば、「今日の天気は晴れです。」は以下のように形態素に分解されます。

  1. 今日
  2. 天気
  3. 晴れ
  4. です
 
    またそれぞれ分解された形態素に情報を付加します。

形要素 形要素の種類 読み
今日 名詞 キョウ
助詞
天気 名詞 テンキ
助詞
晴れ 名詞 ハレ
です 助動詞 デス
句点

    上記に上げた付加される情報は一例で、実際は様々な情報が付加されます。
    というわけで、この辞書がないと音声を生成できません。
    音声を生成する方向性がこの辞書により決まります。

  音声データ

    辞書により形態素解析されたデータから、音声を生成するためのデータです。
    音声を生成するためのデータですから、男性の声や女性の声など使用する音声データにより声質が大きく変わります。

    音声データがないと、音声を合成することができません。

Open JTalkをインストールする

  Open JTalkをインストールします。
  「Ubuntuソフトウェアセンター」を起動し、「open-jtalk」で検索します。


  「インストール」ボタンをクリックします。

  アドオンについて

    以下の2種類のアドオンが表示されます。
    いずれも「Open JTalk」を利用するのに必要なアドオンですので、すべてにチェックを入れ「変更を適用」ボタンをクリックしてください。


    「Japanese male voice data for Open JTalk」は音声データです。
    「NAIST Japanese Dictionary for Open JTalk」は辞書です。

Open JTalkのテストを行う

  「Open JTalk」をインストールしたら、まず「Open JTalk」のテストを行います。

  1.コマンドの実行

    「端末」を起動し、以下のコマンドを実行します。

echo 今日の天気は晴れです。 | open_jtalk -x /var/lib/mecab/dic/open-jtalk/naist-jdic -m /usr/share/hts-voice/nitech-jp-atr503-m001/nitech_jp_atr503_m001.htsvoice -ow ~/open_jtalk.wav

    特に問題がなければ、以下のようにコマンドの実行結果は何も表示されません。


  2.WAVファイルの確認

    「Nautilus」を起動し、自分のホームフォルダーを開きます。
    以下のように「open_jtalk.wav」ファイルが作成されています。


    「open_jtalk.wav」ファイルをダブルクリックして開きます。

  3.WAVファイルの再生

    「Totem」が起動し、WAVファイルが再生されます。


    「今日の天気は晴れです」と音声が流れればOKです。


関連コンテンツ
同一カテゴリーの記事
コメント
オプション