音声合成単語

オンセイゴウセイ
5.3千文字の記事
  • 10
  • 0pt
掲示板へ

音声合成とは、ソフトウェアなどによって人間を模した人工の音を作ることである。
音声合成をおこなうソフトとして、SofTalkゆっくりしていってね!!!)やVOCALOIDVOICEROIDなどがニコニコ内外で有名である。

概要

音声合成ソフトというのは、テキストなどによって入した言葉を読み上げさせるソフトである。

合成音声を作りだす技術として様々な技法が存在するが、あらかじめ記録されている音データを入した文字から呼び出し、それらをつなげることで音を作り出すものが代表的である。

例えば『こんにちは』と入すると、それを『こ』『ん』『に』『ち』『は』分解した単にする。
これらを分析してソフト内に記録された』、『』、『』、『』、『の音を呼び出し、それらを順に並べてくっつけという音を作ち出す。
ただし、ただ単と単をくっつけただけののままでは音のつなぎや強弱、抑揚や発音などが不自然になってしまうので、較的自然に聞こえるよう内部処理をして『こんにちは』という音を作り出している。

この時の音合成する技法や、使用している音によって各社様々なソフトが存在する。
また、VOCALOIDUTAUのように歌唱をさせる事だけに特化した専用のソフトウェアも存在する。

※ちなみに、人間肉声は使用せず、人間音に近い音周波を作り出すフォルマン合成という技法も存在する。例:CeVIOSinsy

歴史

紀元前~19世紀前半

音声合成そのものの歴史は古く、何世紀にも渡る人類のであった。
発明への試みの多くは楽器から始まり、西アフリカに代表されるトーキングドラム等といった代物が開発された。その後、複雑な機構が開発できるような技術が発展した文明などの手によって音声合成を試まれ、何度も音を発音させられる機械等が発明された。1791年になるとヴォルフガング・フォン・ケンペレンの手により、音だけでなく子音も発音できる機構が発表され、より人間の発音に近い音声合成をめられる時代となってきたことにより、この発表された機構を利用したおもちゃなどの開発や更なる技術開発へと発展した。

1930年代、ベル研究所のホーマー・ダドリーによりヴォコーダーが開発。現在でもレコーディング映画アニメなどに用いられている「独特な機械的な」を演出できる技術、携帯電話をはじめとする通信用の音圧縮技術として用いられるその流となった。

コンピューターの時代へ

ついに1950年代の終盤。コンピューターを用いた音声合成が開発された。
そして、1961年。ベル研究所にてIBM 704を使用し、世界初のコンピューターでの音声合成が行われ、『デイジー・ベル』という曲を歌わせることに成功。この成功はVOCALOIDの祖先の祖先ともいえ、『2001年宇宙の旅』でHAL 9000がこの曲を歌うなど逸話も多い。

その後、1980年代に入ると更にコンピューターへの音声合成の導入・開発が行われ、MacAmigaOS、WindowsなどのオペレーションシステムOS)で使用することができた。
特にこの中でFlash黄金期前後にインターネットを使用していた、インターネット老人会に属するものならば、MacのPlainTalkの音を聞いたことがないものはいないだろう。2000年代日本ではゴノレゴをはじめとしたPlainTalkを使用したFlashが有名なものでもいくつか存在し、当時多くの2ちゃんねらーなどを魅した。

VOCALOID、くまうた、ゆっくり・・・

2000年に入ると後に"VOCALOID"と呼ばれるものの開発プロジェクトDAISYプロジェクト」が始動。
このプロジェクト名も先述のベル研究所にてIBM 704が歌った『デイジー・ベル』になぞらえている。
2003年にはVOCALOIDとして名前確立し、発表。2004年にはイギリスを皮切りに日本など世界での販売をおこなった。この年、日本では『MEIKO』が発売され、バーチャルイストゥルメント市場では大ヒットと言われる本数を売り上げることができた。

またそのでは2003年プレイステーション2"くまうた"が登場。VOCALOIDの先駆けとして、個人が作詞をして歌わせる遊びとそのシステムがこの時点で内で既に確立していた。

喋らせる技術に関しても進歩を続けており、2006年に"AquesTalk"、2007年には"AITalk"が開発される。"AquesTalk"は後にSofTalk棒読みちゃんの元に、"AITalk"は後にVOICEROIDの元になった

そして2007年キャラクター・ボーカル・シリーズの第一弾として『初音ミク』が満を持して登場。明期のニコニコ動画でも一躍その名が知られるようになる。動画投稿サイトSNS等、インターネットから始まってその後世界的なVOCALOIDブームを巻き起こした上に、2008年には飴屋P氏により「人力ボーカロイド」を行うための支援ツール"UTAU"も開発され、ここニコニコ動画をはじめとしたインターネット舞台プロ/アマ内/外関係く、オリジナル曲MVなどを投稿し盛り上がる文化の土壌が形成された。

2009年になると"VOICEROID"がパッケージ化。2009年12月4日に初のVOICEROID月読ショウタ』が発売された。2010年代に入ると『東北ずん子』『結月ゆかり』『琴葉茜・葵』などのキャラクター人気となり、先に盛況を得ていたAquesTalk系音声合成ソフトを利用した「ゆっくり」系動画と並んでニコニコ動画ゆっくり実況プレイVOICEROID実況プレイなどの人気動画シリーズを生み出すこととなった。

初期の音声合成はまだ「独特な機械的な」としてしか発することはできなかったが、IBM 704を用いた実験以降も開発は現在までに続いている。また、近年の新たな研究・開発によりブレス吐息)やより人間的な抑揚の再現チューニングの精度向上などが進んでおり、更なる技術の発展が期待される分野である。

ニコニコ動画での立ち位置

ニコニコ動画では、これらの多な音声合成ソフトを使った動画が数多く投稿されており、人気ジャンルのひとつとして幅広くしまれている。

また専用のソフトを介さずにユーザー自身が直接人力で音加工を手がけて歌唱や読み上げを行っているものや、歌唱用音声合成ソフトを喋っているように見せる調整を行ったり読み上げ用音声合成ソフトに歌唱を行わせた動画も多数存在する。

前者の例→人力VOCALOID / 暴歌ロイド
後者の例→棒歌ロイド / トークロイド / HANASU / 歌うボイスロイド

各音にはしばしば、VOCALOIDゆっくりしていってね!!!などのイメージキャラクターが付随しており、他のキャラクターと垣根なく掛け合いをするなど、独自の文化世界観を構築するに至っている。

主な音声合成ソフトの紹介

SofTalk(ソフトーク)

音声合成ミドルウェア「AquesTalk」を音声ライブラリとして使用しているフリーソフト
ニコニコ動画では、ゆっくりしていってね!!!によく利用されている。

あくまでテキスト読み上げのソフトなので歌唱させる機はないが、手作業の加工により歌唱させた動画も存在する。
本気で歌うゆっくりシリーズ / 棒歌ロイド

VOICEROID(ボイスロイド)

AHSから発売されている音声合成ソフト。
株式会社エーアイが開発した業務用の音声合成エンジンである「AITalk」のソフトである。

パッケージ化された音は、当初は「AITalk」本来の男子女児を使ったものであったが、
VOICEROID+VOICEROID2として新たに専用に収録、新規または既存のキャラクターを当てはめたバージョンも発売されている。

詳しくはVOICEROIDを参照。

なお販売会社が違うだけでVOICEROIDと同じAITalkからのソフトである
音街ウナTalk Ex株式会社インターネット
ガイノイドTalk株式会社ガイノイド
ギャラ子Talkヤマハ株式会社
A.I.VOICE(※株式会社エーアイの独自レーベル
も便宜上、広義において「VOICEROID」のくくりに含まれることがある。

これはVOICEROIDという名称が「VOCALOID」と対となる存在として独特の位置にあること、AITalkという本来の名称がVOICEROIDほど一般に浸透していないこと、によるものが大きい。

VOCALOID(ボーカロイド)

した歌詞メロディー、パラメータから歌を生成するボーカルシンセサイザー

VOCALOIDの音声合成エンジンYAMAHAが開発したものであり、ライセンスを受けた各企業によって様々な音データベースが作成され、パッケージ化されている。
パッケージキャラクターごとの音の違いは、ソフト中に組み込まれている音データデースの違いによるもの。
また「VOCALOID01」「VOCALOID02」といったバージョンによって、使用されているエンジンにも違いがある。

詳しくはVOCALOIDを参照。

UTAU(ウタウ)

元々は人力VOCALOID支援ツールとして端を発する歌合成フリーソフト

つまり50音WAVEファイルとして録音しそのり合わせ(た音声ライブラリ)によって歌唱を行うのだが、その音ライブラリは有志によって多種多数が開・配布されており、この配布されている音ライブラリを登録し使用することが一般的な利用方法。

連続音の音声ライブラリも配布されており、使用音とその調整次第では有償の歌合成ソフトに劣らない歌合成も可

詳しくはUTAUを参照。

CeVIO(チェビオ)

トークと歌の両方に対応している音声合成ソフト。2013年発表。

音声合成の仕組みとしては、人間の実音を切り貼りして合成するVOCALOIDなどと異なり、人間を出す過程をシミュレートして音合成するものであり、口や喉の形、の大きさや高さなどがパラメータとなる。
CeVIOの音声合成エンジン名古屋工業大学が開発したものであり、ライセンスを受けた各企業によって様々な音データベースが作成され、パッケージ化されている。

また、2021年には更にディープラーニング技術を組み込んだ「CeVIO AI」も発売されている。

詳しくはCeVIOを参照。
  

大百科に記事がある音声合成ソフトの一覧

ア行 カ行 サ行
タ行 ナ行 ハ行
マ行 ヤ行 ラ行
ワ行 その他 ハードウェア

関連動画

 関連静画

関連ニコニコQ

 関連項目

外部リンク

【スポンサーリンク】

  • 10
  • 0pt
記事編集 編集履歴を閲覧

この記事の掲示板に最近描かれたお絵カキコ

お絵カキコがありません

この記事の掲示板に最近投稿されたピコカキコ

ピコカキコがありません

音声合成

124 ななしのよっしん
2022/08/25(木) 07:27:24 ID: s4Jcb2qRhY
>>123 うんだから、商業ラインに乗せて実用化されてないのはなぜ?
👍
高評価
0
👎
低評価
0
125 ななしのよっしん
2022/08/28(日) 16:08:46 ID: NmtCvDePmG
商業ラインには乗ってるし実用化してるぞ
案内音みたいなのは音声合成を使ってることが今やかなり多いだろ
エーアイとかテクノスピーチみたいな音声合成扱う企業の売り上げの大半は業務用だ
👍
高評価
0
👎
低評価
0
126 ななしのよっしん
2022/10/29(土) 12:03:44 ID: BVkFjNfzpI
音声合成ソフトの名称問題はニコニコ公式側が既に間違えてるところが一番問題を助長させてると思うわ
公式から合成音声ソフトって表現してるし
👍
高評価
0
👎
低評価
0
127 ななしのよっしん
2022/11/03(木) 09:40:52 ID: dYTLkcPWrt
ニコニコがわざわざ合成音声っていうのなんでなんだろうな?
音声合成だとどっか権利関係にひっかかったりするのか?
👍
高評価
0
👎
低評価
0
128 ななしのよっしん
2022/11/03(木) 17:09:01 ID: wec9YUUZ8H
キャラ付けのライブラリもっと増えろください
👍
高評価
0
👎
低評価
0
129 ななしのよっしん
2022/12/23(金) 19:43:16 ID: SD5vIZAyze
>>127
ReadspeakerのHOYAがクリティカル商標を持っているみたいね
👍
高評価
0
👎
低評価
0
130 ななしのよっしん
2022/12/25(日) 03:13:26 ID: PZcxaZwNR0
おんせーごーせー
より
ごーせーおんせー
の方が喋っててしっくりくるけどなぁ
👍
高評価
3
👎
低評価
0
131 設xキン
2023/01/02(月) 01:35:52 ID: 7T26jrt7vn
男性と老人の音声合成少なくて(泣く)
👍
高評価
1
👎
低評価
0
132 ななしのよっしん
2023/03/29(水) 12:32:57 ID: FBDME9nJXP
>>130
気持ちはめっちゃわかるし同意するんだけど、
合成音声だと「音を合成して作られた」の意味になるから
いま流の「サンプリングして合成する」のはやっぱり音声合成と呼ばざるを得ないのよね

サンプリングなしで機械音を合成してを作り出す方式なら「合成音声ソフト」と呼ばれるようになるはず
👍
高評価
1
👎
低評価
0
133 ななしのよっしん
2023/03/31(金) 06:19:05 ID: HD7jKRHjVq
>>132
>サンプリングなしで機械音を合成してを作り出す方式
AquesTalkみたいな、いわゆる中の人がいないタイプのことだと思うけど、その場合でもやっぱり「音声合成ソフト」じゃない?
👍
高評価
0
👎
低評価
0