まほろば

音響モデルを自作する5(音素ラベリング)




.

音響モデルを自作する5(音素ラベリング)

投稿者:マーチン  2016年9月3日 【記事印刷】

 音声データに含まれる音素の開始・終了時間を認識(音素ラベリング)したファイルを作成する環境を、Ubuntu上に構築します。アキヒロ氏が作成した「音素ラベル作成ツール」を使わせてもらいます。

●Julius のインストール

(1)Synaptic パッケージ・マネージャを起動する。
(2)[検索] をクリックして、”Julius”と入力し、[Julius] で右クリックして、[インストール指定] を選択する。

(3)[適用] をクリックする。

●音素ラベル作成ツール のインストール

(1)なんかいろいろしてみます。SHABERU を開く。
(2)[ツール]をクリックし、”segment_atr503_windows-v1.0”の[Download] をクリックし、ダウンロードしたzipファイルを解凍する。
(3)”segment_atr503.pl” は、環境の違いでうまく動かなかったので、一部を修正して実行した。
  1. Ctrlキーを押しながら、”segment_atr503.pl” をドラッグ&ドロップして、コピーを作成する。
  2. コピーしたファイル名を、”segment_atr503_2.pl”に変更して、エディタで開く。
  3. 8行目: $julius4bin="./bin/julius-4.2.1.exe"; を、 $julius4bin="julius";
  4. 78行目: push(words, $_); を、 push(@words, $_);
  5. [保存] [×] をクリックする。
(4)解凍したフォルダ内で、右クリックして、[端末を開く] を選択する。

(5)コマンドウインドウで、以下のように入力する。

segment_atr503_windows-v1.0 $ perl segment_atr503_2.pl

(6)以下のように表示されたら正常終了。


(7)何かのキーを押して終了し、コマンドプロンプトを閉じる。
(8)フォルダ”akihiro” の下に、3つのフォルダ”full, mono, raw” が作成されていて、a01.* から a05.* のファイルが有ることを確認する。
(9)フォルダ”raw” で以下のコマンドを入力すると、音声が再生されることを確認する。

~HTS/segment_atr503_windows-v1.0/akihiro/raw $ play -r 48k -b 16 -e signed-integer a01.raw


◆連載

◆関連記事

  このエントリーをはてなブックマークに追加
.
△ 先頭へ