まほろば

音響モデルを自作する4(サンプルデータ)




.

音響モデルを自作する4(サンプルデータ)

投稿者:マーチン  2016年9月3日 【記事印刷】

 音声モデルを自作する環境が整ったので、名古屋工業大学が公開しているサンプルデータを使って音響モデルを作ってみます。

●準備

 そのまま実行すると、”SPTK/bin/raw2wav” 実行時の変数uid が定義されていないエラーが発生しました。それを回避するため、以下の作業をします。(他の回避方法があるかもしれませんが)
(1)端末で以下のコマンドを実行する。

~/HTS $ cd ~
~ $ gedit .bashrc

(2)最後の行に、次の1行を追加して、[保存] [×] をクリックする。

export uid=$USER


(3)端末を一度閉じ、もう一度端末を開いて、以下のコマンドを実行すると、ユーザ名が表示されることを確認する。

~/HTS $ env | grep uid
uid=ユーザ名

(4)長い計算時間がかかるので、Windowsの設定で、電源接続時にスリープ状態にならないようにする。Windows10の場合、[スタート] [設定] [システム] [電源とスリープ] で、[なし]を選択する。

●20個のサンプルから音響モデルを作成

(1)[ファイル] [ホーム] [HTS] を開く。
(2)[HTS-demo_NIT-ATR503-M001.tar.bz2] で右クリックして、[ここに展開する] を選択すると、フォルダ”HTS-demo_NIT-ATR503-M001” ができる。
(3)”HTS-demo_NIT-ATR503-M001/data” を開き、[raw] をCtrl を押しながらドラッグ&ドロップして、[raw(コピー)] を作成する。
(4)”HTS-demo_NIT-ATR503-M001/data/raw”内のファイルを、a01.wav~a20.wav の20個だけ残して削除する。
(5)[ファイル] [ホーム] [HTS] [HTS-demo_NIT-ATR503-M001] で右クリックして、[端末で開く] を選択する。
(6)端末で以下のコマンドを実行する。 (文字列が長いので黒色文字をコピペで)

~/HTS/HTS-demo_NIT-ATR503-M001 $ ./configure --with-sptk-search-path=$HOME/HTS/prog/SPTK/bin --with-hts-search-path=$HOME/HTS/prog/htk/bin --with-hts-engine-search-path=$HOME/HTS/prog/hts_engine_API/bin
~/HTS/HTS-demo_NIT-ATR503-M001 $ make

(7)バックグランドで perl のプログラムが走ります。(Running a training/synthesis perl script (Training.pl) in background....) 以下のメッセージが出ても、終了していません。

(8)バックグランドで実行しているジョブをやめるには、psコマンドで”Training.pl”を実行している PID を探して、killコマンドで停止する。

~/HTS/HTS-demo_NIT-ATR503-M001 $ ps u
~/HTS/HTS-demo_NIT-ATR503-M001 $ kill -KILL (PID)


(9)ログファイルをリアルタイムに表示するには、

~/HTS/HTS-demo_NIT-ATR503-M001 $ tail -f log

 ※表示を停止するには、Ctrl + C を押す。
 ※正常終了した時のログファイルの最後の10行は、

(10)進捗具合を確かめるには、以下のコマンドが便利。終了時には 31行が出力される。

~/HTS/HTS-demo_NIT-ATR503-M001 $ grep ^start -G -i log | nl


●20文での学習結果

(1)総所要時間は、約6分。実行環境は以下の通りで、表は 使用したマシンの CrystalMark 2004R3 のベンチマーク結果です。
  CPU : intel(R) Core(TM)i7-4610M CPU @3.00GHz
  HDD : SSD (SANDISK X300s SD7SB3Q)
  VirtualBoxシステム : メインメモリ:4096MB プロセッサ:2

(2)”HTS-demo_NIT-ATR503-M001/voices/qst001/ver1” に音響モデル(nitech_jp_atr503_m001.htsvoice) が作成される。
(3)”HTS-demo_NIT-ATR503-M001/gen/qst001/ver1/hts_engine” にwav形式のサンプル音声が作成される。

●503文での実行

(1)”HTS-demo_NIT-ATR503-M001/data" を開いて、フォルダ”raw”を削除して、フォルダ”raw(コピー) ”の名前を”raw” に戻す。
(2)[ファイル] [ホーム] [HTS]を開いて、[HTS-demo_NIT-ATR503-M001] で右クリックして[端末を開く]を選択して、以下のように実行する。

~/HTS/HTS-demo_NIT-ATR503-M001 $ ./configure VER=2 --with-sptk-search-path=$HOME/HTS/prog/SPTK/bin --with-hts-search-path=$HOME/HTS/prog/htk/bin --with-hts-engine-search-path=$HOME/HTS/prog/hts_engine_API/bin
~/HTS/HTS-demo_NIT-ATR503-M001 $ make


●503文での学習結果

(1)同じ実行環境で、perlプログラムが走り出すまでに約45分、総所要時間は、約4時間20分。
(2)”HTS-demo_NIT-ATR503-M001/voices/qst001/ver2” に音響モデル(nitech_jp_atr503_m001.htsvoice) が作成される。
(3)”HTS-demo_NIT-ATR503-M001/gen/qst001/ver2/hts_engine” にwav形式のサンプル音声が作成される。

●おまけ

 HTS-demo_NIT-ATR503-M001 内のrawデータを再生してみました。
(1)[HTS-demo_NIT-ATR503-M001/data/raw] で右クリックして、[端末で開く] を選択する。
(2)端末で以下のコマンドを実行すると、音声ファイルが再生される。

~/HTS/HTS-demo_NIT-ATR503-M001/data/raw $ play -r 48k -e signed-integer -b 16 nitech_jp_atr503_m001_a01.raw

 ※以下の様な画面表示はされるのに、音が出ない場合はそれ以降を参考にしてください。

(3)”VirtualBox マネージャー”で、[設定] [オーディオ] で、設定を確認する。

(4)[システム設定] [サウンド] で設定を確認し、[テスト]で音を聞く。

(5)それでもダメなら、以下のサイトを参照して、チェックしてください。
  https://wiki.ubuntulinux.jp/UbuntuTips/Hardware/SoundTroubleshooting


◆連載

◆関連記事

  このエントリーをはてなブックマークに追加
.
△ 先頭へ