Amazon Pollyとは、Amazonが提供する音声合成サービスである。
概要
ネット通販でおなじみAmazonのもう一つの家業、Amazonの持つ最新技術をクラウドで自由に利用できる総合webサービスであるAWS(Amazon Web Service)において提供される技術/機能のうちの一つ。
AWSのWEBコンソールからAmazon Pollyのサービスにアクセスし、表示される入力欄にテキストを入力するだけでAI(ディープラーニング)が用いられた流暢な音声ファイルが高速に作成可能で、メジャーな開発言語に対応しておりAPIとして他のアプリケーションに組み込んでの連携利用なども可能。
使用できる言語は29ヶ国、男女音声選択可能。標準的な TTSボイスに加えて、より自然で人間的な音声品質を備えたニューラルテキスト読み上げ(NTTS)ボイスも一部言語で選択可能。なお日本語の音声はMizuki(女性)とTakumi(男性)の二種類となっている。
HTMLタグに似た音声合成マークアップ言語(SSML)による記述で発音、声量、声の高さ、読み上げ速度などの細かなチューニングも可能。出力ファイルのオーディオ形式も選択できる。一度生成した音声は追加料金なしで再生可。
料金体系としては最初の1年間は500万字/月まで無料で利用でき、その後は従量課金制(100万字あたり、4.00USD/月)となっている。
関連動画
ニコニコにおいては朗読などでの用途が一般的だが、これを高度に調声した上でゲーム実況等のキャラの声当てに使用する投稿者も稀に存在する。
というかほぼあの二人組だけな気はしないでもない
関連リンク
関連項目
- 0
- 0pt