DiffSinger単語

ニコニコ動画でDiffSingerの動画を見に行く

ディフィシンガー

1.3千文字の記事

掲示板へ

記事編集

DiffSingerとは、浅い拡散メカニズム(拡散モデル)を利用した歌声合成である。

概要

DiffSingerは2021年に論文が発表され、2022年 1月17日にPytorch版の公式実装がGithubで公開された。その後Open VPI版のフォークが作成された。現在最新版はVer2.4.0である。

更に他のユーザーによりOpen VPI版を元にGoogle Colabで利用できる学習にノートブックや
個人のPCで利用可能な学習ツールDiffTrainerが公開されている。

個人で作成可能なAI歌唱合成として人気があり様々なユーザーから音源が配布されている。

対応エディターは現在 OpenUtauのみのため利用にはOpenUtauが必須である。

関連リンクに各種リポジトリ、ツールのリンクを掲載しています。

利用方法

DiffSingerの音源(音響モデル)を簡単に利用するにはOpenUtauを利用する必要がある。

最新版のOpenUtau ダウンロードする。
OpenUtauのWikiのDiffSinger support ページから
nsf_hif igan voc oderをダウンロードする。
nsf_hif igan.oudepをOpenUtauのメインウィンドウにドラッグアンドドロップで
インストールすることで利用可能になる。
お好きな音源をダウンロード
メインウィンドウにドラッグアンドドロップでインストールすることで利用可能になる。

特徴

まず、DiffSingerは拡散モデルではあるが
画像作成AIと異なり無作為に大量に音声データを収集して作る必要はない。

主な特徴としてマルチスピーカーと言われる物があり、
一つの音源に複数の声質や複数の言語を学習できる。

学習データを相互に組み合わせることで日本語話者の声で英語やフランス語、
中国語話者や英語話者で日本語といったクロスリンガルを実装可能である。

また、声質を別々に学習させることでUTAUで言う統合音源のような事もできる。

OpenUtauで声質を操作する場合は表情編集部分のCLR:Voice Colorタブのラジオボタンで
ノートごとに設定できる。

他にも表情設定から選択している音源の表情を追加できる。
追加したVoice Colorはカーブ（曲線）編集の形を取っており
カーブを書き換えることで声質の適応度合いや声質を混ぜる事ができる。

他にもの音源によって以下の表情をカーブ編集で操作できる。

Gender(フォルマント)
Tension(声の強弱、息の量)
Energy(声の強弱)
Brea thin ess(息の量)
Voicing(有声化度合い)
Velocity(発音速度)
Pitch Express iv ene ss(ピッチ表現力)

ニコニ広告で宣伝された記事

ニコニ広告 (単) 記事と一緒に動画もおすすめ！

提供：ゲスト２

254745700pt

この記事の掲示板に最近描かれたお絵カキコ

お絵カキコがありません

この記事の掲示板に最近投稿されたピコカキコ

ピコカキコがありません

DiffSinger

まだ掲示板に書き込みがありません…以下のようなことを書き込んでもらえると嬉しいでーす！

記事を編集した人の応援(応援されると喜びます)
記事に追加して欲しい動画・商品・記述についての情報提供(具体的だと嬉しいです)
DiffSingerについての雑談(ダラダラとゆるい感じで)

書き込みを行うには、ニコニコのアカウントが必要です！

DiffSinger単語

概要

利用方法

特徴

関連動画

日本語話者による音源

他言語話者による音源

関連リンク

関連項目

親記事

子記事

兄弟記事

ニコニ広告で宣伝された記事

この記事の掲示板に最近描かれたお絵カキコ

この記事の掲示板に最近投稿されたピコカキコ

DiffSinger

急上昇ワード改

おすすめトレンド

ニコニコニューストピックス

DiffSinger単語

概要

利用方法

特徴

関連動画

日本語話者による音源

他言語話者による音源

関連リンク

関連項目

親記事

子記事

兄弟記事

この記事をもとに新規記事を作成

ニコニ広告で宣伝された記事

この記事の掲示板に最近描かれたお絵カキコ

この記事の掲示板に最近投稿されたピコカキコ

DiffSinger

急上昇ワード改

おすすめトレンド

ニコニコニューストピックス