ユーザーモデル(ソフトウェアトーク)単語

ソフトウェアトークノユーザーモデル
4.4千文字の記事
  • 2
  • 0pt
掲示板へ

ユーザーモデル(ソフトウェアトーク)とは、「ソフトウェアトークユーザーモデル応援祭」の開催時に発祥した「個人配布の音声合成モデル」を包括的に呼称するための単である。

この単は、前述した投稿祭催「いろは」が便宜上提唱しているグループであり、現状は投稿祭参加者やその周辺の人々が使用している単に過ぎないため、各サービス運営システム開発者の合意による公式のものではないことをご留意いただきたい。

この項では、現状のソフトウェアトーク界におけるユーザーモデル定義について説明する。

概要

2023年7月現在のユーザーモデル(ソフトウェアトーク)の定義は以下のとおりである。

しかし該当するサービスソフト、起用の形態の増加と多様化が著しく、CoeFontのようにこの定義の例外も存在しており、この単はあくまで「一つのソフトでまとめられない個人製作系の音声合成キャラクター」を包括的に呼ぶための曖昧なグループ名である。

存在意義としてはニコニコ運営ユーザーへの普及を図っている「ソフトウェアトーク」に近い。

は該当する合成音声トークモデル)らが、MikuMikuDanceユーザー制作・配布3Dモデルす「MMDユーザーモデル」のソフトウェアトーク版のような存在であることから。

キャラクターの利用規約や管理体制も千差万別で、利用状況によっては配布者が配布を取り止める可性もあるため、規約の事前確認は必須事項である。

ユーザーモデルを作成可能なサービス・ソフト

CoeFont(旧サービス名:CoeFont_CLOUD)

アリアルミリアルアベルーニで御染み、Web上で合成音声を利用できる会員制のAIサービステキスト読み上げサービスの利用は500円~のサブスクリプション方式で、別途課金することで自分のを使った合成音声「コエフォント」を作成、CoeFontサイト上で開できるようになる。

利用した際は「Voiced by CoeFont.CLOUD」のクレジット表記が必須。

2023年9月現在、コエフォントの収録形態は、独自のコーパス文章を1003000文収録して制作するベーシックな制作プランと、2022年1月に開催されたCoeFontFES2022を機に追加された、4種の「感情コエフォントプラン」が存在する。


  • 喜び(1000円/400文/収録時間60分~)
  • 怒り1000円/400文/収録時間60分~)
  • 悲しみ1000円/400文/収録時間60分~)
  • 喜び1000円/400文/収録時間60分~)

ソフト較すると課金必須というはあるものの、収録はブラウザ完結で、読み仮名とアクセント表記もわかりやすく併記されている仕様。しかも簡易的なバックグラウンドノイズの除去と学習工程も全てCoeFont側が請け負ってくれるため、「日本語話者であれば難しい知識がなくとも合成音声が作れる」のが最大の強み。

また、感情コエフォントの収録においては、特化した感情を込めやすくなるよう収録文章を変しており、その点でも初心者に優しい。

お試しで自分のAI合成音声を作りたい初心者にも最適な選択肢の一つだと言える。

通常コエフォント制作プランが最高精度プランのみになる前に用意されていた旧プランは以下の3通り。



ユーザーモデル応援祭では「アリアルミリアルアベルーニひろゆきなどの公式コエフォントを除く、ユーザー制作のコエフォント」をレギレーションとしている。

TALQu

Haruqa氏が開発した深層学習TTS読み方は「トーク」で。現行BOOTHで配布されているバージョンは正式には「TALQu2」

一般的なトークソフトのように上下アクセントで調声する機ではなく「テキストをもとに喋り再現した音を生成し、ピッチ線(音程)を描いてアクセントを修正する」形式で調声するピッチ調声形式のTTS

有志が配布したトークモデルTALQu本体のModelsフォルダに格納することでモデルリストに追加できるシステムを採用しており、TALQu2ではデフォルトモデルの「Haruqa」、TALQu3からはHaruqaに加え、公式キャラクターとなった「十九モチ」「こちぇ」「コル音イム」以外のトークモデルユーザー自身がDL、追加する必要がある。

はるぽラボのポイント交換システムまたはHaruqa氏のFanboxおよびポイント交換システムで利用できる「TALQu3 PRO」と、Google Colabを利用したWeb版「TALQuNote」についてはTALQuの項にて。

2023年9月現在TALQu2のユーザーモデル作成ルートは以下の2通り。



また、過去に存在した以下の作成ルートは「TALQu3」開発のため、新規の学習受付を停止している。



VEルートITAコーパスルートで作成したモデルは、TALQu2の初期搭載ボコーダーとの相性によっては生成した音音質劣化する可性がある。その場合は、公式キャラクター質を中心にボコーダーがチューンナップされ、対応できる音域が拡大した「TALQu3」で使用してみるか、はるぽラボにて開されている専用ボコーダー作成キットを使用し、専用ボコーダーを制作することで解決することができる。

また、TALQuに関しては他のソフトサービスべるとクオリティの確保に大量の音収録が必要とされる傾向にあるが、収録文章数を任意で増やせるのが他のユーザーモデルにない最大の特徴でもあり、類似した収録文章のアクセントや発音のニュアンスをきちんと統一すれば一貫した喋り方に、バラけさせれば遊びのあるガチャ要素になっていく。

ガチャ要素は他のソフトにない個性でもあるため、沢山収録すればアクセントが正確になると言うよりは「沢山収録するほど表現が豊かになる」傾向があるのがTALQuということかもしれない。

TALQu2では「Haruqa」を除く追加トークモデルの全てがユーザーモデルに該当していたが、TALQu3からは「Haruqa」以外の公式実装トークモデルが増えたため、ユーザーモデル応援祭では「TALQu3の初期実装トークモデル(公式キャラクター)を除いたユーザー制作トークモデル」をレギレーションとしている。

COEIROINK(MYCOEIROINK)

つくよみちゃんをはじめとしたトークモデルが存在するCOEIROINKにも、2022年4月Google Colabのノートブックを使用したトークモデル自主制作・追加機MYCOEIROINK」が実装された。

こちらは「speaker_info」フォルダにトークモデルが入ったフォルダを格納することでトークモデルを追加可。学習データにはITAコーパス読み上げ文424文を使用し、学習ベースモデルは二種類から選択できる。ITAコーパスに感情をこめて読み、それぞれを別途学習させたモデルを一つのフォルダにまとめることで複数スタイル実装も可既に30スタイル以上配布している猛者が存在している。

学習元のデータ音質にもよるが、ITAコーパスのみでもかなり高品質のトークモデルを作成することが可較的ユーザーモデルの利用者も獲得しやすく、現状のユーザーモデル制作ソフトと言っても過言ではない。

2022年10月より、拡収録要素として、疑問文日常会話向け単の強化を図ることができる「MANAコーパス」が実装されたことに加え、ITAコーパス全収録せずとも学習させることも可になり、作成できるトークモデルの品質と参入のしやすさがさらに向上した。

2023年6月より、UIを一新した「COEIROINK v2」がリリースされた。COEIROINK(v1)まではVOICEVOXと同じUI、かつVOICEVOX系列のソフトマルチエンジンで併用できた。COEIROINK v2」はVOICEVOX系列ではなくなったため互換性がなくなった。有志によってVOICEVOXとの連携ソフトウェアが作成されている。(COEIROINK v2更新によって利用不可になる可性がある他、非公式のため自己責任で利用すること)

ユーザーモデル応援祭では「公式モデルを除いた個人製作トークモデル(MYCOEIROINK)」をレギレーションとしている。

関連リンク

関連項目

【スポンサーリンク】

  • 2
  • 0pt
記事編集 編集履歴を閲覧

この記事の掲示板に最近描かれたお絵カキコ

お絵カキコがありません

この記事の掲示板に最近投稿されたピコカキコ

ピコカキコがありません

ユーザーモデル(ソフトウェアトーク)

まだ掲示板に書き込みがありません…以下のようなことを書き込んでもらえると嬉しいでーす!

  • 記事を編集した人の応援(応援されると喜びます)
  • 記事に追加して欲しい動画・商品・記述についての情報提供(具体的だと嬉しいです)
  • ユーザーモデル(ソフトウェアトーク)についての雑談(ダラダラとゆるい感じで)

書き込みを行うには、ニコニコのアカウントが必要です!


ニコニコニューストピックス