音声合成単語

1074件
オンセイゴウセイ
5.4千文字の記事
  • 13
  • 0pt
掲示板へ

音声合成とは、ソフトウェアなどによって人間を模した人工の音を作ることである。
音声合成をおこなうソフトとして、SofTalkゆっくりしていってね!!!)やVOCALOIDVOICEROIDなどがニコニコ内外で有名である。

概要

音声合成ソフトというのは、テキストなどによって入した言葉を読み上げさせるソフトである。

合成音声を作りだす技術として様々な技法が存在するが、あらかじめ記録されている音データを入した文字から呼び出し、それらをつなげることで音を作り出すものが代表的である。

例えばこんにちはと入すると、それを『こ』『ん』『に』『ち』『は』分解した単語にする。
これらを分析してソフト内に記録された』、『』、『』、『』、『の音を呼び出し、それらを順に並べてくっつけという音を作ち出す。
ただし、ただ単語と単語をくっつけただけののままでは音のつなぎや強弱、抑揚や発音などが不自然になってしまうので、較的自然に聞こえるよう内部処理をしてこんにちはという音を作り出している。

この時の音合成する技法や、使用している音によって各社様々なソフトが存在する。
また、VOCALOIDUTAUのように歌唱をさせる事だけに特化した専用のソフトウェアも存在する。

※ちなみに、人間肉声は使用せず、人間音に近い音周波を作り出すフォルマン合成という技法も存在する。例:CeVIOSinsy

歴史

紀元前~19世紀前半

音声合成そのものの歴史は古く、何世紀にも渡る人類のであった。
発明への試みの多くは楽器から始まり、西アフリカに代表されるトーキングドラム等といった代物が開発された。その後、複雑な機構が開発できるような技術が発展した文明などの手によって音声合成を試まれ、何度も音を発音させられる機械等が発明された。1791年になるとヴォルフガング・フォン・ケンペレンの手により、音だけでなく子音も発音できる機構が発表され、より人間の発音に近い音声合成をめられる時代となってきたことにより、この発表された機構を利用したおもちゃなどの開発や更なる技術開発へと発展した。

1930年代ベル研究所のホーマー・ダドリーによりヴォコーダー開発現在でもレコーディング映画アニメなどに用いられている「独特な機械的な」を演出できる技術、携帯電話をはじめとする通信用の音圧縮技術として用いられるその流となった。

コンピューターの時代へ

ついに1950年代の終盤。コンピューターを用いた音声合成が開発された。
そして、1961年ベル研究所にてIBM 704を使用し、世界初のコンピューターでの音声合成が行われ、『デイジー・ベル』という曲を歌わせることに成功。この成功はVOCALOIDの祖先の祖先ともいえ、『2001年宇宙の旅』でHAL 9000がこの曲を歌うなど逸話も多い。

その後、1980年代に入ると更にコンピューターへの音声合成の導入・開発が行われ、MacAmigaOS、WindowsなどのオペレーションシステムOS)で使用することができた。
特にこの中でFlash黄金期前後にインターネットを使用していた、インターネット老人会に属するものならば、MacのPlainTalkの音を聞いたことがないものはいないだろう。2000年代日本ではゴノレゴをはじめとしたPlainTalkを使用したFlashが有名なものでもいくつか存在し、当時多くの2ちゃんねらーなどを魅した。

VOCALOID、くまうた、ゆっくり・・・

2000年に入ると後に"VOCALOID"と呼ばれるものの開発プロジェクトDAISYプロジェクト」が始動。
このプロジェクト名も先述のベル研究所にてIBM 704が歌った『デイジー・ベル』になぞらえている。
2003年にはVOCALOIDとして名前確立し、発表。2004年にはイギリスを皮切りに日本など世界での販売をおこなった。この年、日本では『MEIKO』が発売され、バーチャルイストゥルメント市場では大ヒットと言われる本数を売り上げることができた。

またそのでは2003年プレイステーション2"くまうた"が登場。VOCALOIDの先駆けとして、個人が作詞をして歌わせる遊びとそのシステムがこの時点で内で既に確立していた。

喋らせる技術に関しても進歩を続けており、2006年に"AquesTalk"、2007年には"AITalk"が開発される。"AquesTalk"は後にSofTalk棒読みちゃんの元に、"AITalk"は後にVOICEROIDの元になった

そして2007年キャラクター・ボーカル・シリーズの第一弾として『初音ミク』が満を持して登場。明期のニコニコ動画でも一躍その名が知られるようになる。動画投稿サイトSNS等、インターネットから始まってその後世界的なVOCALOIDブームを巻き起こした上に、2008年には飴屋P氏により「人力ボーカロイド」を行うための支援ツール"UTAU"も開発され、ここニコニコ動画をはじめとしたインターネット舞台プロ/アマ内/外関係く、オリジナル曲MVなどを投稿し盛り上がる文化の土壌が形成された。

2009年になると"VOICEROID"がパッケージ化。2009年12月4日に初のVOICEROID月読ショウタ』が発売された。2010年代に入ると『東北ずん子』『結月ゆかり』『琴葉茜・葵』などのキャラクター人気となり、先に盛況を得ていたAquesTalk系音声合成ソフトを利用した「ゆっくり」系動画と並んでニコニコ動画ゆっくり実況プレイVOICEROID実況プレイなどの人気動画シリーズを生み出すこととなった。

初期の音声合成はまだ「独特な機械的な」としてしか発することはできなかったが、IBM 704を用いた実験以降も開発現在までに続いている。また、近年の新たな研究開発によりブレス吐息)やより人間的な抑揚の再現チューニングの精度向上などが進んでおり、更なる技術の発展が期待される分野である。

ニコニコ動画での立ち位置

ニコニコ動画では、これらの多な音声合成ソフトを使った動画が数多く投稿されており、人気ジャンルのひとつとして幅広くしまれている。

また専用のソフトを介さずにユーザー自身が直接人力で音加工を手がけて歌唱や読み上げを行っているものや、歌唱用音声合成ソフトを喋っているように見せる調整を行ったり読み上げ用音声合成ソフトに歌唱を行わせた動画も多数存在する。

前者の例→人力VOCALOID / 暴歌ロイド
後者の例→棒歌ロイド / トークロイド / HANASU / 歌うボイスロイド

各音にはしばしば、VOCALOIDゆっくりしていってね!!!などのイメージキャラクターが付随しており、他のキャラクターと垣根なく掛け合いをするなど、独自の文化世界観を構築するに至っている。

主な音声合成ソフトの紹介

SofTalk(ソフトーク)

音声合成ミドルウェア「AquesTalk」を音声ライブラリとして使用しているフリーソフト
ニコニコ動画では、ゆっくりしていってね!!!によく利用されている。

あくまでテキスト読み上げのソフトなので歌唱させる機はないが、手作業の加工により歌唱させた動画も存在する。
本気で歌うゆっくりシリーズ / 棒歌ロイド

VOICEROID(ボイスロイド)

AHSから発売されている音声合成ソフト。
株式会社エーアイ開発した業務用の音声合成エンジンである「AITalk」のソフトである。

パッケージ化された音は、当初は「AITalk」本来の男子女児を使ったものであったが、
VOICEROID+VOICEROID2として新たに専用に収録、新規または既存のキャラクターを当てはめたバージョンも発売されている。

詳しくはVOICEROIDを参照。

なお販売会社が違うだけでVOICEROIDと同じAITalkからのソフトである
音街ウナTalk Ex株式会社インターネット
ガイノイドTalk株式会社ガイノイド
ギャラ子Talkヤマハ株式会社
A.I.VOICE(※株式会社エーアイの独自レーベル
も便宜上、広義において「VOICEROID」のくくりに含まれることがある。

これはVOICEROIDという名称が「VOCALOID」と対となる存在として独特の位置にあること、AITalkという本来の名称がVOICEROIDほど一般に浸透していないこと、によるものが大きい。

VOCALOID(ボーカロイド)

した歌詞メロディー、パラメータから歌を生成するボーカルシンセサイザー

VOCALOIDの音声合成エンジンYAMAHA開発したものであり、ライセンスを受けた各企業によって様々な音データベースが作成され、パッケージ化されている。
パッケージキャラクターごとの音の違いは、ソフト中に組み込まれている音データデースの違いによるもの。
また「VOCALOID01」「VOCALOID02」といったバージョンによって、使用されているエンジンにも違いがある。

詳しくはVOCALOIDを参照。

UTAU(ウタウ)

元々は人力VOCALOID支援ツールとして端を発する歌合成フリーソフト

つまり50音WAVEファイルとして録音しそのり合わせ(た音声ライブラリ)によって歌唱を行うのだが、その音ライブラリは有志によって多種多数が開・配布されており、この配布されている音ライブラリを登録し使用することが一般的な利用方法。

連続音の音声ライブラリも配布されており、使用音とその調整次第では有償の歌合成ソフトに劣らない歌合成も可

詳しくはUTAUを参照。

CeVIO(チェビオ)

トークと歌の両方に対応している音声合成ソフト。2013年発表。

音声合成の仕組みとしては、人間の実音を切り貼りして合成するVOCALOIDなどと異なり、人間を出す過程をシミュレートして音合成するものであり、口や喉の形、の大きさや高さなどがパラメータとなる。
CeVIOの音声合成エンジン名古屋工業大学開発したものであり、ライセンスを受けた各企業によって様々な音データベースが作成され、パッケージ化されている。

また、2021年には更にディープラーニング技術を組み込んだ「CeVIO AI」も発売されている。

詳しくはCeVIOを参照。
  

大百科に記事がある音声合成ソフト/サービスの一覧

ア行 カ行 サ行
タ行 ナ行 ハ行
マ行 ヤ行 ラ行
ワ行 その他 ハードウェア

関連動画

 関連静画

関連ニコニコQ

 関連項目

外部リンク

関連記事

子記事

兄弟記事

  • なし

【スポンサーリンク】

  • 13
  • 0pt
記事編集 編集履歴を閲覧

ニコニ広告で宣伝された記事

FC音源 (単) 記事と一緒に動画もおすすめ!
提供: ***
もっと見る

この記事の掲示板に最近描かれたお絵カキコ

お絵カキコがありません

この記事の掲示板に最近投稿されたピコカキコ

ピコカキコがありません

音声合成

146 ななしのよっしん
2024/02/22(木) 10:53:25 ID: ATB/+VUAfH
そういえばゆっくりボイスFLASHSAPI4もトモコレ読み上げも「男声」なのにやたら女みたいな甲高いだよね
>>sm37191663exit_nicovideo

>>sm19519250exit_nicovideo

>>sm38149984exit_nicovideo
👍
高評価
1
👎
低評価
0
147 ななしのよっしん
2024/03/10(日) 19:02:07 ID: 8V5xuxLsE2
界隈観察した結果
合成音声TTS、おしゃべりをしていて
音声合成は全般で歌ソングを含む総称として扱われてる

合成音声って言い方をしてる人がいたらまずTTSだと思われ玄人志向に感じる
この定義でいいならリダイレクト解除して別記事化しても問題ないと思われ
👍
高評価
0
👎
低評価
5
148 ななしのよっしん
2024/03/10(日) 20:26:25 ID: VMP4EW+7ld
>>sm43391524exit_nicovideo
👍
高評価
0
👎
低評価
1
149 ななしのよっしん
2024/03/15(金) 18:46:06 ID: 28icxP98mZ
>>147
レス番号>>93あたりからその話あるけど、
2年くらい前にそのタグ他人の動画に勝手にり付けて一時期数千個単位に増やして(bot?)た人がいたけど
1週間も持たず運営通報かで全部消えてた事件とかあったので軽挙はしないように
👍
高評価
1
👎
低評価
0
150 ななしのよっしん
2024/03/15(金) 18:57:52 ID: 8V5xuxLsE2
>>149
勝手に話をすり替えられてるけどリダイレクト化から一度も動いた様子はない
だからリダイレクト化解除して>>147定義で意味を書いても問題ないのではと言う大百科線での意見
動画タグの話は一切してないし議論に上げること自体を軽挙と非難するのはどうかと思う
👍
高評価
0
👎
低評価
1
151 ななしのよっしん
2024/03/15(金) 22:41:01 ID: 28icxP98mZ
>>150
議論に上げる事すら咎めたつもりは一切ない
ただ音声合成/合成音声の用語の用法はユーザーレベルどころか
企業レベルでブレがあるし(AHSテクノスピーチ等は歌唱・読み上げどちらも『音声合成』)

音声合成―歌唱合成
      |
       L読み上げ合成―

という前提でこれまで積み上げられてきた過去大百科記事も
下手をすると全部用語の使い方から変わってしまうことになるのだから
事前に十分な議論いまま安易にリダイレクト化を解除して分割したりすることには慎重論を述べたまでだよ
👍
高評価
4
👎
低評価
0
152 ななしのよっしん
2024/08/07(水) 22:27:39 ID: GaEOv0RWaO
voicepeakかった
👍
高評価
0
👎
低評価
0
153 ななしのよっしん
2024/08/19(月) 13:04:03 ID: VxJkH525Xk
youtubeお茶を濁していた期間、色んな動画合成音声が使われるようになっているのがわかったがやっぱり発音が正しくないのがにつく。
粗製乱造上等みたいな輩ならともかく長年使ってるであろう人の動画でさえあるのにはちゃんと国語勉強してるのかと思ってしまった。
まあ動画制作したことがない身だからどのくらい苦労するか知らないってのもあるが・・・。
👍
高評価
0
👎
低評価
0
154 ななしのよっしん
2024/08/28(水) 09:08:22 ID: wec9YUUZ8H
イントネーションがなんかおかしいのはまあいいとしても、固有名詞とかの単語の読み方とかを間違えてるのはさすがにどうかと思う。まさかと思うが生テキストまんま打ち込んでたりしないよな?
👍
高評価
1
👎
低評価
0
155 ななしのよっしん
2024/09/09(月) 14:04:34 ID: VMP4EW+7ld


>>lv345708484exit_nicolive
👍
高評価
0
👎
低評価
0

急上昇ワード改