ITAコーパスとは、パブリックドメインの日本語テキストコーパスである。
概要
Emotion100文(2954文字)、Recitation324文(7943文字)の計424文で構成されている。
作成の経緯
- ATR503文(有料)
- 声優統計コーパス(CC BY-SA 二次著作物公開時にクレジットの表示が必要)
- JSUTコーパス(CC BY-SA 二次著作物公開時にクレジットの表示が必要)
- JVS コーパス(CC BY-SA 二次著作物公開時にクレジットの表示が必要)
などがある。
合成音声の研究には元となる音声が大量に必要であるが有料のコーパス文章・読み上げ音声の購入もしくは公開されている音声か自身で音声を作成したうえで、ライセンス付きで成果物を公開する方法が主であった。
そのため、「無償であること」「パブリックドメインであること」「読みやすいこと」「読み上げる文章数を抑えること」を目的に、2021年にSSS合同会社がクラウドファンディングを立ち上げ、音素バランス文の新規開発を企画。明治大学と九州工業大学と共同でITAコーパスが開発された。
ITAはInter-field Task Acceleratingの略ではあるが、実は後付け。
東北イタコ音声合成データベース制作プロジェクトのクラウドファンディングから企画・開発されたコーパスのため、「イタコーパス」とつけられた。詳しくは下記のツイート参照。「アイティーエーコーパス」ではない。
【参照記事】
高い、使いにくい、読みにくい──音声合成研究者を悩ませるハードルを解決する“台本”、明治大学らが発表(ITmedia NEWS)
ITAコーパスの名前が付いた経緯のツイート
ポストを読み込み中です
https://twitter.com/t_zunko/status/1285957532637261824
開発者
敬称略
- プロジェクト総括:小田恭央(SSS合同会社)
- プロジェクト管理:金井郁也(明治大学)
- 文章作成・管理:小口純矢(明治大学)
- 文章抽出:細田計
- アドバイザ:齊藤剛史(九州工業大学),森勢将雅(明治大学)
ITAコーパス音声を使用するソフトウェア
トークソフト
上記のトークソフトでは、ユーザー側で音声モデルを自作して導入することが可能。音声モデルの制作の際にITAコーパス音声を使用する。
※TALQuには「Haruqaコーパス」 COEIROINKには「MANAコーパス」が存在するため、ITAコーパス音声を使用せずとも合成音声の作成は可能。
ボイスチェンジャーソフト
「好きな声のITAコーパス音声100文」「自身が読み上げたITAコーパス音声100文」の2種類を用意することで、好きな声でしゃべることができる。
ITAコーパス読み上げ音声配布サイト
- 研究者向け マルチモーダルデータベース(SSS合同会社) ※Twitterでのログインが必要
他、ITAコーパス音声配布サイトは多数存在するが、MMVCの大百科記事に有志がまとめたITAコーパス読み上げ音声配布サイトのリンクが存在する。
関連リンク
- ITAコーパスの文章リスト公開用リポジトリ
- ITAコーパス:パブリックドメインの音素バランス文からなる日本語テキストコーパスの構築と基礎評価
情報処理学会に掲載されているITAコーパスの論文
関連項目
- 3
- 0pt