ITAコーパス収録メモ

音声合成
この記事は約4分で読めます。

苔色かげITAコーパスを収録した際の、やり方や個人的注意点を自分用に書いてみる。

最初にITAコーパスを録り始めたのは4月28日頃。なぜそこから配布までに半年程も空いてしまったのかというと、単純に録音環境の問題。エアコンやストーブが必要な季節だと、それらの雑音が入ってしまい録音できないから。EMOTION100文を録り終わり、RECITATION324文の途中まで録った4月から間が空いた10月に録音を再開。これがやはり良くなかった。続きから録った音源は以前録った音源と話し方や話す速度が違いすぎて、トータルで聴いたとき安定した音声素材にならなかった。結局10月11日にもう一度イチから録音し直した。収録はなるべく間を空けない方がいい。

次に、録音に使用するソフトについて。最初は巽さんが公開しているブログ記事を参考に、REAPERでリージョン機能を使い録音していた。

この方法も大変有用なやり方なのだが、私の場合は以下の点が気になった。

  • 読み上げ文リージョンにルビが振られていない
  • 読み間違えた場合の対処
    …トラックを追加して複数テイク録ったものから選別するか、録音を途中で中断して読み直さなければならない

ということで自分なりにやり方を変えてみた。

使用ソフトをStudio Oneに変更。これに関しては別にREAPERのままでも出来たかもしれない。録音の方法は、次の手順で行った。

  • 下のWebアプリでルビ付きの台本を表示する。
EMOTION100_001 | daihon
  • Studio Oneで新規ソングを作成。
    ソングの長さ(スタート – エンドマーカー)は収録に掛かりそうな最大の時間まで伸ばしておく。私は1時間にした。
    サンプルレート・解像度は48kHz/24bitくらいで十分だと思う。私は念のためビット数を32bit floatにした。
  • マイクの入力ボリュームを、絶対にクリッピングしない音量に調節しておく。
    一度録音を開始したら録音の入力ボリュームは収録が完全に終わるまで変えないこと!
    ホワイトノイズの除去が一括で掛けられなくなる。
  • トラックを作成し録音開始。Webアプリに表示された文章を自分の任意のタイミングで読んでいく。
  • 途中で読み間違えた場合も録音を止めない。
    読み間違えた、噛んでしまった、いい感じに読み上げられなかったと思ったらまず一呼吸間を置く。
    納得のいく読み上げが出来るまで繰り返し読む。
    ちゃんと読めたな、雑音も入っていないな、と思ったら少し間を取ってから台本を次に進める。

    2024/05/17追記:一文の録り始め・録り終わりはRキーのショートカットを使えば、スクロールを止めることなくマイクのON/OFFだけ切り替えられる。そうしておくことで収録の段階でリージョンを分けることができ、後で手作業での切り出しが不要になる。その方法を強くおすすめしたい。
  • ITAコーパスの読み上げが全て終わったらここで初めて録音を止める。
    息が続かなくて休憩したい場合は途中で止めても良いかも。ただし読み方や話す速度のブレに注意。

    ITAコーパスじゃなくてROHANコーパスの場合は、休憩を取るか日を跨いで収録する必要が確実にありそう……
  • 必要な箇所の切り出しを行う。こんな感じで。
    収録の段階でリージョンを分けておいた場合はこの作業が丸々不要になる(!!!)

この作業中に「よく聴いたら読み間違えてる!」とか「雑音入ってる!」と気づいたらもう一度その文だけ録り直す。ただし読み方や話す速度以下略。

  • オーディオイベントのそれぞれにITAコーパスのファイル名を付けてオーディオファイルをレンダリングする。
    ホワイトノイズの除去もこのときに行う。
    Studio Oneだとここだけ手作業でファイル名を付けないといけない。自動で付けられるような方法があったら教えてください……
    REAPERでやる場合はやはりリージョンマーカーを使うと良いと思う。このやり方の場合は同じく手作業。
    巽さんが書いた上記ブログの方法で行う場合はリージョンマーカーが既に設定されており手作業不要。
  • <ソングフォルダ>\Bounces にITAコーパスのファイル名がついたオーディオファイルが書き出されるので、それを適当な場所にコピーする。
  • それらのファイルをもう一度聴いて読み間違いが無いか、ファイル名が正しいかどうか最終確認して大丈夫だったら完了!
    私の場合は48kHz/32bit floatで収録したので、ITAコーパスとして配布する用に48kHz/24bitに、MYCOEIROINKの学習用に44.1kHz/16bitに変換したファイルも適宜用意した。

以上が私なりのやり方だ。

次は津軽弁アクセントで録ったり、枯色ヤモのITAコーパスも録ったりしたい。ROHANコーパスは……まとまった時間が取れるなら挑戦してみるかもしれない。

コメント

タイトルとURLをコピーしました