Voicebox 単語


ニコニコ動画でVoiceboxの動画を見に行く

ボイスボックス

Voiceboxとは、Meta社が開発したデモンストレーション用音生成AIモデルである。

ヒホ氏により開発されたテキスト読み上げソフトウェアではない。

概要

Meta2023年6月に発表した音生成AIモデル

従来の音生成AIは、整備されたトレーニングデータを使用して、タスクごとに個別のトレーニングを行う必要があった。これに対し、Voiceboxはトレーニングデータを使わずに、収録した音と補足する書き起こしから学習する「Flow Matching」というアプローチを採用。わずか2ほどの音と入力テキストから、リアル読み上げを可にしている。また、インコンテクスト(文脈内)学習と呼ばれる手法により、音を生成するだけではなく、ノイズ等の音のセグメントをシーレスに編集することも得意としている。さらに、多言語にも対応しており、入力した言語とは別の言語に変換し出力することも可。発表時点では英語フランス語ドイツ語スペイン語ポーランド語ポルトガル語に対応している。

将来的にはこの機を利用して、話すことができない人に音を届けたり、NPCバーチャルアシスタントが使用する音カスタマイズすることも可だとしているが、「この技術が誤用や意図しないをもたらす可性がある」という理由から、モデルコードの一般開は行なわれていない。

関連項目

この記事を編集する

掲示板

掲示板に書き込みがありません。

おすすめトレンド

ニコニ広告で宣伝された記事

記事と一緒に動画もおすすめ!
ニコニ広告[単語]

提供: おしる子

もっと見る

急上昇ワード改

最終更新:2026/02/05(木) 01:00

ほめられた記事

最終更新:2026/02/05(木) 01:00

ウォッチリストに追加しました!

すでにウォッチリストに
入っています。

OK

追加に失敗しました。

OK

追加にはログインが必要です。

           

ほめた!

すでにほめています。

すでにほめています。

ほめるを取消しました。

OK

ほめるに失敗しました。

OK

ほめるの取消しに失敗しました。

OK

ほめるにはログインが必要です。

タグ編集にはログインが必要です。

タグ編集には利用規約の同意が必要です。

TOP