開発者がドキュメントの整備を放棄しました。 現在の仕様と異なる可能性があります。 ユーザーが本当に必要としている機能に厳選して、加筆・訂正などをして下さる協力者を求めています。 |
WEB版VOICEVOXとは、ブラウザでVOICEVOXを使えるサイトである。
定義
WEB版VOICEVOXとは、インターネット経由でVOICEVOXを使えるようにしたサービスの総称であり、誰でも同様のサービスを展開することができる。(VOICEVOXは商標です。サービス名に用いる場合はご注意ください。)本記事では、その中でもsu-shiki.comが提供している非公式のWEB版VOICEVOXについて重点的に解説する。
簡易版
最初期に公開したWEB版VOICEVOXを、現在は簡易版として公開を続けている。CSSフリーと揶揄されるほどに現代的な装飾を省いた、とてもシンプルなデザインである。必要な設定も少なく、文章を入力して「音声・音声記号列を生成」ボタンを押せば簡単に音声を聴くことができる。一部WAVを再生できないブラウザの場合、ダウンロードリンクを押せば保存できる。
プロジェクト版
簡易版と違って〇〇版といった呼称はないが、説明のためプロジェクト版と呼ぶこととする。2021年12月現在トップ画面にあるのがこのプロジェクト版であり、プロジェクトを作成して音声を一つずつ登録していくという特徴がある。各プロジェクトにはプロジェクトkeyが割り当てられ、保存期間と最大ファイルサイズが定められている。
プロジェクトkey
プロジェクトを作成したらまずプロジェクトkeyをメモするなり、コピペするなり、何らかの方法で記録しておくことを強く推奨する。ブラウザを閉じてしまった場合、履歴から戻っても作業内容は消えてしまう。しかし、プロジェクトkeyがあれば保存した字幕ファイルからプロジェクトを復元することができる。また、後からプロジェクトを圧縮したりダウンロードする際にもプロジェクトkeyが必要になることがある。
プロジェクトkeyは強力である。これがあれば自由に書き換えたり、削除したり、プロジェクトを破棄することさえできる。したがって、プロジェクトkeyは安易に公開してはならない。
保存された音声ファイルと字幕ファイル
セリフの登録を行うと、音声ファイル(.wav)と字幕ファイル(.txt)が生成され、ダウンロードリンクとして表示される。これをクリックすることでダウンロードができる他、後述の一括ダウンロードでも保存できる。また、テキストエリア内の文字を書き換えると、何かしらのボタンを押したタイミングで字幕ファイルが更新される。どのボタンを押せばよいか迷ったときは「保存して反映」ボタンを押すと良い。「保存して反映」ボタンは複数あるが、どれも同じである。
ダウンロード用のzipを作成
ダウンロードリンクを一つずつクリックすることも可能だが、zip方式で圧縮して一括ダウンロードすることもできる。その際は、使用する編集ソフトで利用しやすい命名規則を選択すると良い。なお、命名規則よりもカスタム規則が優先されるため、命名規則を選択する際はカスタム規則を空欄にしなければならない。
「実行」ボタンを押すと別タブでダウンロードリンクが開く。zipのファイル名はUNIX時間になる。ダウンロードリンクの下にはSHA256sumが表示される。また、選択した命名規則に対応するカスタム規則を覚えておけば、次回以降数字を入力するだけで同じ命名規則を適用できる。どちらが楽かは人それぞれだろう。
命名規則とカスタム規則
命名規則を変えずに実行した時のカスタム規則は0である。キャラごとにフォルダを分けると1、キャラ名を付けると2、別モードを別キャラとして扱うと4、キャラ名を全角にすると8、ファイル名にセリフを含めると16がそれぞれカスタム規則に加算される。また、特定のソフトとの連携を想定して特殊な命名規則を作る場合、マイナスのカスタム規則が割り当てられることとなっている。
AviUtlでUTF-8が文字化けすることが報告されている。その場合、命名規則で文字コードを「Shift-JIS(Windows)」に変更することで回避することができる。ただし、ファイル名にエスケープが必要な文字列(「/」など)が含まれていると、WindowsではダウンロードしたZIPファイルの中身が空と表示される不具合がある。なお、「Shift-JIS(Windows)」を選択するとカスタム規則に10000加算される。
カスタム辞書
トップページの「カスタム辞書を作成・編集」からカスタム辞書を作成し、編集することができる。辞書はCSV形式で記述されており、上から順番に正規表現に該当する文字列を置き換えるものである。カスタム辞書を作成すると、カスタム辞書keyが割り当てられる。これを使って編集、削除ができる他、カスタム辞書を適用するのにも必要である。大切に保管されたい。
カスタム辞書を作成すると、次のようなデフォルト状態の辞書が生成される。
/voicevox/i,ぼいすぼっくす
/重複/,ちょうふく
/変換前/,変換後
上から順に、まず「voicevox(大文字小文字不問)」を「ぼいすぼっくす」に置き換え、次に「重複」を「ちょうふく」に置き換える。「/変換前/,変換後」は、「変換前」を「変換後」に置き換える指示である。任意に書き換えて辞書をカスタマイズしてほしい。なお、POSTの送信に上限があるため、設定できる単語数は有限である。
カスタムプリセット
カスタムプリセットでは、使用するキャラクターと、キャラクターごとのデフォルトパラメーターを指定できる。カスタムプリセット(64進数)の計算ページでこれらの設定を64進数に圧縮してプロジェクトに適用する。カスタムプリセットを適用できるタイミングはプロジェクト作成時のみである。カスタムプリセットが適応されているプロジェクトにデフォルトパラメーターと表示するキャラクターのチェックボックスは表示されない。
プロジェクトの復元、圧縮、ダウンロード
プロジェクトは破棄されるまでの間、プロジェクトkeyで復元、圧縮、ダウンロードができる。すでに閉じたプロジェクトの編集をするには、まず字幕ファイルからプロジェクトを復元する必要がある。トップページの「プロジェクトを復元」にプロジェクトkeyを入力して実行する。復元に成功すれば、編集画面へ移動するボタンが表示される。また、圧縮とダウンロードもトップページから実行できる。この場合、それぞれカスタム規則とファイル名がプロジェクトkeyの他必要である。なお、プロジェクトの破棄はトップページから行うことが出来ない。
春日部つむぎ動画メーカー
WEB上で作成した音声をつなぎ合わせて、動画形式で出力する。画面サイズは854×480と480×854が選択可能であり、字幕の縁取りは白と黒から選択できる。背景画像はPNGまたはJPEGの画像をアップロードすることができ、画面サイズに引き伸ばされる。一方セリフごとにアップロードできる参考画像は、縦横比を維持して縮小・拡大される。
簡易モーフィング
2021年12月現在、公式の製品版UIでモーフィングは実装されていないが、モーフィング自体は公式の機能でありWEB版オリジナルではない。基底キャラクターと対象キャラクターの中間の音声を合成する機能である。割合が0であれば基底キャラクター、割合が1であれば対象キャラクター、割合が0.5であればちょうど中点で合成される。
死活監視・メンテナンス情報
VOICEVOXをリアルタイムで処理するにはある程度の演算能力が必要であり、HTTPサーバーとは別に計算機サーバーを用意して運用している。何らかの理由で計算機サーバーの応答がない場合、WEBページは表示されるが音声が生成されないことがある。このような状態に陥った場合、何度もリクエストを送るのではなく、一旦死活監視・メンテナンス情報を開いていただきたい。こちらのページであれば、何回リロードしても計算機サーバーに負荷がかかることはない。
商標
VOICEVOX は 廣芝 和之 の登録商標または商標です。su-shiki.comとtts.questが提供するAPI、WEBサイトおよびその他の同様のコンテンツは 廣芝 和之 に承認されたものではありません。
関連動画
関連ゲームアツマール
関連リンク
関連項目
- 5
- 0pt