CVVC収録音源とは、歌唱合成(主にUTAU)における音源形式の一種である。CV-VC収録音源とも表記する。
概要
CVVCのCとはconsonant(子音)、Vとはvowel(母音)のこと。CVVC収録音源は、音素を「(子音)+(母音)」「(母音)+(子音)」の形に分割して取り扱う。
日本語での歌唱合成を考える時に最も直感的に判りやすい方法は、ひらがな一字一字の歌声を繋ぎ合わせる方法。この考えかたに基づいて収録された音源を単独音(CV)音源と呼ぶ。
しかし、この方法では欠落してしまう情報が存在する。母音から子音へ移行するとき(日本語で言うならば二つのひらがなの中間)にある音である。この問題を解決する一つの方法が連続音(VCV)音源、もう一つがCVVC収録音源である。(他にも連単音方式などがあるがここでは割愛する)
連続音音源との比較
CVVC収録音源はCV-VCとも表記される通り、単独音(CV)音源に母音→子音(VC)部分の音素を追加している。
一方、連続音音源は単独音音源における全ての音素に対して、直前にある母音5種および「ん」からの変移+語頭(直前に何も無い) の7パターンを総あたりで収録する。
(- ハ)+(an)+(ナ)+(ag)+(ガ)+(as)+(サ)+(ai)+(イ)+(it)+(タ)+(ay)+(ヨ)
(- ハ)+(a ナ)+(a ガ)+(a サ)+(a イ)+(i タ)+(a ヨ)
収録の効率性や音源のコンパクトさでは連続音音源に勝り、合成速度の低下や不自然さの原因になりうる接続部分の多さでは連続音に劣る。 といったところ。
CVVCの考え方自体はかなり昔から存在する(Diphone合成という)ものであるが、UTAU連続音音源は近年、多音階化やアペンド化、多言語対応化が進む中で過剰なサイズ肥大化傾向にあり、音源スペックを確保しつつ現実的なサイズに抑えるのに有望な技術ではないかと言われ始めている。
関連動画
波音リツEve + autoCVVC for Namine
変わった発音の母音での収録が可能かどうかのテスト音源&その音源用プリセットを内蔵した打ち込み支援プラグイン
朱音イナリCVVC
上記音源の収録リストによるCVVC音源。こちらは普通の日本語発音。
ミナライモナ(英語CVVC音源)
CVVC方式は特に日本語以外の言語での歌唱合成に有効(母音の種類の多さや子音同士の組み合わせに起因する)
関連コミュニティ
関連項目
- 0
- 0pt