Synthesizer V AIは、多言語歌声合成対応に

Synthesizer V Studio 1.5.0のリリースを発表します。

バージョン1.5.0では、AIベースのSynthesizer Vが大幅にアップグレードします。

 

Dreamtonicsでは、より人の声に近いリアルな歌声合成で本格的な音楽制作を可能にすることを目標としています。今回のアップデートでは、その目標に大幅に近づいたと言えるでしょう。

 

多言語歌声合成

1.5.0アップデートで注目していただきたいのが、多言語歌声合成の機能追加です。これまでのAI歌声データベースは、ベースとなる歌手の言語により制限されていました。

例えば、日本人の歌手からサンプルを収録して制作したSynthesizer VのAI歌声データベースは、日本語でしか歌えませんでした。

 

Dreamtonicsのディープラーニングの研究により、AI歌声データベースは、元の歌手の言語にかかわらず、流暢に英語・日本語・中国語を歌えるようになりました。音楽を制作するすべての人へ、理想的な歌声の選択肢の幅を広げることになります。

 

次の動画は、「We Wish You a Merry Christmas」を3カ国語で歌う、多言語歌声合成機能のデモとなります。

 

音声の品質とスピードの向上

言語機能の拡張に加え、Synthesizer V AIは品質の面でも大きく進歩しています。

人の声と合成音声の境界線をさらに曖昧にするような、これまでにない豊かなディテールを実現しました。

 

また機能と品質の向上は、合成エンジンの大規模な最適化と並行して行われました。

ユーザーが合成音声を制作する際、よりスピーディーに制作した音声を確認することが可能です。いままでの50%~80%ほどスピードアップしています。

これは、Synthesizer V AIリリースからわずか1年で3倍近くまでスピードアップしたことを意味します。

 

合成音声のスペクトログラムと収録した音声の比較

 

歌声データベースのアップデート

今回のアップデートにより、以下の歌声データベースが多言語機能に対応する予定です。

 

Saki AI v118

青溯 (Qing Su) v103

弦巻マキ AI (日本語) v107

弦巻マキ AI (英語) v103

小春六花 AI v115

ついなちゃん AI v103

エレノアフォルテ (Eleanor Forte) AI v103

杏里 (ANRI) v103

 

男声AI歌声データベースを近日公開

2021年6月にサンプルを公開いたしました、アメリカ英語ネイティブの男性AIボイスデータベースを、2022年春頃リリースすることが決定致しました。

 
 

詳しいリリースノートは以下をご覧ください。


Synthesizer V Studio 1.5.0 (2021年12月23日)

 

新機能

Synthesizer V エンジン:AI歌声データベースでの多言語対応を追加(Pro版のみ)。歌声パネルの「下記の言語で歌う」で設定可能です。

ピアノロール:音符を拡大する際に隣の音符を自動的に縮小する機能を追加。設定パネルの「重ならないようにノートのサイズを調整」で設定可能です。

その他:クラッシュリカバリの追加。

 

仕様変更

自動処理:「自動ピッチ調整」を異なるパターンで再実行するためのショートカット(Alt + R)を追加。

編集:メニュー項目「ピッチプロパティをリセット」を「ピッチをリセット」に改名し、ノートのピッチプロパティとノートの下のピッチベンドパラメータの両方がリセットされるようになりました。

ピアノロール:選択されたノートのコンテキストメニューにリセットコマンドと「ノートのパラメータを選択」コマンドを追加。

 

機能強化

Synthesizer V エンジン:AI歌声データベースの高速化と高スペクトル解像度モデルへの対応を追加。

自動処理:AIの自動ピッチ調整の表現力が向上。

再生:歌声データベースが選択されていない状態でトラックが再生された時に、ユーザーに通知するためのハイライトエフェクトを追加。

レンダリング:エンジンの内部サンプリングレートと異なるレートにエクスポートする際のリサンプリングの品質を向上。

 

バグ修正

ピアノロール:ある特定の順番で選択した音符をドラッグするとクラッシュする問題を修正。

ファイル:多数のトラックを含むプロジェクトをロードすると、トラックの順序がリセットされる問題を修正。

プラグイン:macOS でプラグインから再生するときに再生位置が固まる問題を修正。