Audacityを使って複数のwavファイルを一括に発話区間検出(VAD)する

AudacityのSoundFinderを複数のファイルに一括適用します。

VADをしたいファイルを複数用意します。

以下のPython3用のスクリプトを実行します。

wavファイルをおいていたディレクトリにwav_list.lofというファイルができているのでAudacityで読み込みます。

Audacityで複数トラックの音声ファイルを時間をずらして読み込めます。

SoundFinderを実行します。この操作でVADを行うことになるので適宜パラメータを調整してください。

VADを行ったラベルデータを書き出します。

以下のPython3用スクリプトを実行します。ラベルのパスとlofファイルのパスは指定してください。

 

複数の音声ファイルに一括で発話区間検出のラベルを作ることができました。

音声ファイル名.txtがAudacityで使えるラベルデータとなります。

あとはこれを読み込んでsoxで切り取るなりすれば発話ごとの音声ファイルになります。

ちなみにファイルパスに2バイト文字(日本語など)が入っているとAudacityの謎仕様により読み込めません




No Comments


You can leave the first : )



Leave a Reply

Your email address will not be published. Required fields are marked *