「Synthesizer V AI Mai」とは、歌声合成ソフトウェア「Synthesizer V」用のAI歌声データベースである。
概要
Dreamtonics社による歌声合成ソフト「Synthesizer V」は、歌声データベースを切り替えることによって様々な声質・キャラクターの歌声を合成することができる。
その歌声データベースは「Synthesizer V」本体の提供元であるDreamtonics社以外にも様々な企業から発売されているが、この「Mai」はDreamtonics社自身が提供している。その関係で、「Synthesizer V」ユーザーへのサービス、あるいは利用促進という面もあってか「Mai」自体は無料で提供されている。ただし、利用には「Synthesizer V Studio Pro」本体が必要である。
2022年10月27日にデモソングとともに発表され、その後2022年11月10日に「Synthesizer V Studio Pro」のバージョン1.8.0b1ユーザー向けにリリースされた。
ツイートを読み込み中です
https://twitter.com/dreamtonics_jp/status/1585542062459551749
ツイートを読み込み中です
https://twitter.com/dreamtonics_jp/status/1590600926217527296
公式Twitterによれば「ハリのあるポップな歌声が特徴で、ダンスミュージックからアイドル系、特にJ-Pop全般に適しています」とのことである。
商用利用については「MaiはDreamtonicsの他の歌声データベースと同じライセンス条件が適用されるため、Maiを使って作成した作品の商用利用に制限はありません。」とのこと。[1]
なお、公式の「キャラクター設定」や「画像」などは発表されていないようだ(2022年11月19日現在)。キャラクターイメージ画像を公開している人(例えば「Froggy」氏など)もいるが、これは個人が歌声からのイメージで描いた非公式のものである。
当初は音声提供者は非公開だったが、2023年3月15日にシンガーソングライターの橘田ほのかであることが発表された。
関連動画
リリース当日の2022年11月10日から、複数のユーザーが動画を投稿している。以下に数作品を紹介するが、英語楽曲が含まれている点からもわかるように、多言語に対応している。
これら早期投稿者たちの感想コメントでは、「先発のSynthesizer V AI歌声データベースらと比べても、AIによる自動歌声合成機能が強力であり、ベタ打ち(未調声)でもかなり自然な歌声を出力してくれる」といった感嘆の声が多いようだ。
Maiは「Synthesizer V Studio Pro」の新バージョン「1.8.0b1」専用としてリリースされたが、このバージョンでは新たに「今までの歌唱合成エンジンを大きく進化させたDiffusion Probabilistic Models(DPM)ベースの歌声合成技術に対応」したと発表されている。
DPM(Diffusion Modelsとも)技術は近年画像生成AIにおいて使用され有名になったものだが、これを歌唱合成技術に応用したものであるらしい。「これまで以上に自然な発音とニュアンスの再現、ビブラートを中心とした正確な音程を実現します。」とのこと。
要するに、先発の歌声データベースらと一線を画している「Mai」の能力は「この技術に対応した最初の歌声データベースであるから」という面もあるかと思われる。ちなみに、先発のAI歌声データベースも順次更新されてこのDPM機能に対応していく予定であるそうだ。
関連リンク
関連項目
- Synthesizer V
- ソフトウェアシンガー
- AI
- NovelAI Diffusion / Waifu Diffusion (どちらもDiffusion Probabilistic Models(DPMs)を用いた画像生成AI)
脚注
- 1
- 0pt