AV1単語


ニコニコ動画でAV1の動画を見に行く
エーブイワン
3.6千文字の記事
  • 7
  • 0pt
掲示板へ

AV1のロゴAV1またはAOMedia Video 1とは、Alliance for Open Media(以下AOMedia)が開発する動画圧縮規格の一つである。2018年3月28日AOMedia Video Codec 1.0として正式に仕様開された。ニコニコ動画でも採用の動きがある、詳細は後述する。

概要

VP8VP9の直接的な後継としてH.264など既存動画圧縮技術の置き換えをしている。その最大の特徴はロイリティフリーであることで、H.265で発生した複雑怪奇なパテントプール問題や不透明特許使用料問題を解決するものとして注されている。

開発の中心を担うAOMediaAmazonアップルARM、シスコ、FacebookGoogleIBMインテルマイクロソフトMozillaAI半導体メーカー NVIDIANetflixなどと、現代の代表的なIT界の巨人が参加メンバーとなっている。

特徴

動画投稿サイトやVODなどストリーミング向けに設計されている。エンコードに計算力を要する一方、再生負荷は相対的に小さい。再生数が多い動画コーデックをAV1にすることで動画転送量を下げ、回線輻輳を抑えることができる。ただ圧縮率に対して計算コストが高くアーカイブ用途にはあまり向かない。

その性質は個人や小規模な運用より大規模事業者向けという趣があり、変換コスト<回線コストが成り立つケースにおいて威力を発揮する規格とも言える。パーソナルユースでは再生することはあっても作成する機会は少ないかもしれない。ブロードキャスト用途もアップロードを負荷の低いコーデックに任せ、配信サーバーでAV1に変換送出など間接的な使用が多いのではないかとされる。直接配信ハードウェア支援など環境整備を待つ必要がある。

再生にかかる負荷が相対的に小さいとはいえH.264など既存のコーデックより要される性は高い。特にバッテリー駆動で省電力をめられる携帯端末や非力な組み込み機器には再生支援は不可欠となる。策定メンバー半導体企業が居るのもこのため。それでも余程古い機器でもない限り最適化によってFullHD程度の解像度であればソフトウェアデコードでも再生できるようになってきている。

ニコニコ動画との関係

上述の通り再生負荷は相対的に小さいが逆にエンコード時間、計算コストはとても大きい。それはひとえに雑巾絞りに喩えられるような圧縮技術の採用にある。もととなった既存コーデックの発展形でありつつもパテント回避のため新規の圧縮技法を導入した結果、最適な結果を得るため動画の解析にとてつもない量の時間が必要になってしまった。

現状、リファレンス実装のlibaom最適化の進んでいる第三者実装SVT-AV1でさえリアルタイムエンコードは厳しく、AV1の高画質が活きる設定(cpu-used=0や1程度)ではCore i9だろうがThreadripperだろうが1080pで数十fpsも怪しい状況である。現実的な速度リアルタイム動作させようとすれば品質を落とすしかなく、これではH.265VP9から移行する利点がんでしまう。

ニコニコ生放送を擁するドワンゴとしてもそれではいけないということで

ハードウェア支援を自前でやろうということにしたらしい。

いやいやニコニコ半導体企業じゃないでしょなんで?な話だが、圧縮と回路技術に明るいエンジニアが社内にいたらしく、エンコードパラメータは限定されるが2019年3月時点で720p 30fpsの性を達成した。内製とか家電メーカーかよという気もするがもともとニコニコにはH.265配信FPGA実装して配信テストをした実績がありハードウェアに強いエンジニアが在籍してる模様。なぜAOMに参加しないのか。

それはそれとして蓄積ニコニコ動画の方がAV1対応するかは未だ不明である。ただYouTube2018年9月15日からベータ版として既にAV1配信を開始している。Googleはスケールしないなら分割エンコードすればいいじゃないとばかりに力技で運用しているという噂もある。そのため回線コストで元が取れるならニコニコ動画も追随する可性は十分にあると思われる。AWSを札束で殴ればドワンゴだって対抗できるのかもしれない。

とりあえず使ってみたい人は

  1. ここexitからlibaomFFmpegexitダウンロード
  2. aomenc.exeエンコーダ

動画をy4m化
>ffmpeg -i src.mp4 -pix_fmt yuv420p -f yuv4mpegpipe temp.y4m

Opus化
>ffmpeg -i src.mp4 -c:a libopus -b:a (ビットレート[kbps]) audio.opus

1パス
>aomenc --threads=(使用CPUコア数) --end-usage=vbr --passes=2 --pass=1 --fpf=FirstPassStatisticsFile.fpf --cpu-used=1 --tile-columns=(縦分割数) --tile-rows=(横分割数) --color-primaries=(色間) --transfer-characteristics=(ガンマ) --matrix-coefficients=(YUV⇔RGB変換式) --output=FirstPassStatisticsFile.fpf temp.y4m

2パス
>aomenc --threads=(使用CPUコア数) --end-usage=vbr --passes=2 --pass=2 --target-bitrate=(ビットレート[kbps]) --fpf=FirstPassStatisticsFile.fpf --cpu-used=1 --tile-columns=(縦分割数) --tile-rows=(横分割数) --color-primaries=(色間) --transfer-characteristics=(ガンマ) --matrix-coefficients=(YUV⇔RGB変換式) --output=video.webm temp.y4m

とMUX
>ffmpeg -i audio.opus -i video.webm -c:v copy -c:a copy out.webm

libaomパイプとy4mファイル(生のYUVデータに簡単なメタ情報をつけたコンテナ)二通りの入力をサポートしている。ただしパイプ入力はInter Prediction [フレーム間予測]や2-Passエンコードにおいて制限や予期せぬ動作を招くためあまり勧められていない。パイプ入力でcpu-used=0(複雑度最高)だとエンコーダーが落ちてしまう。
ただファイル読み込むにしても、y4mは単純な形式な故にタイムコード字幕などのメタデータ、そしてカラープロファイルを保持できない。ソースVFR(スマホで撮した動画など)であればCFRにしておくかタイムコード情報timecode v1なりnhmlとして、メタデータffmetadataで別途書き出してMUXするなど工夫する必要がある。

ライセンスの問題

AOMediaするロイリティフリーは法的に全なものでないことに留意したい。
AV1をめぐる特許についてライセンス契約が必要だとする団体も現れている。

2020年7月6日、Sisvel
https://www.sisvel.com/insights/av1-is-a-copy-cat-codec/exit

2023年10月18日Avanci
https://www.avanci.com/2023/10/18/avanci-video-launched-as-licensing-platform-for-internet-streaming-services/exit

2025年1月16日Access Advance
https://accessadvance.com/2025/01/16/access-advance-announces-video-distribution-patent-pool-in-response-to-market-demand/exit

関連リンク

関連項目

【スポンサーリンク】

  • 7
  • 0pt
記事編集 編集履歴を閲覧

ニコニ広告で宣伝された記事

この記事の掲示板に最近描かれたお絵カキコ

この記事の掲示板に最近投稿されたピコカキコ

ピコカキコがありません

AV1

68 ななしのよっしん
2025/09/16(火) 18:25:05 ID: WAGjC5H/A9
👍
高評価
1
👎
低評価
0
69 ななしのよっしん
2025/09/27(土) 02:30:57 ID: WAGjC5H/A9
👍
高評価
0
👎
低評価
0
70 ななしのよっしん
2025/10/02(木) 12:01:43 ID: WAGjC5H/A9
👍
高評価
1
👎
低評価
0
71 ななしのよっしん
2025/10/12(日) 22:31:42 ID: WAGjC5H/A9
AV2 Video Codec Architecture, presented by Andrey Norkin, Netflix
https://youtube.com/watch?v=Se8E_SUlU3wexit
AV2の圧縮効率はAV1で約30%向上。ブロック分割イントラ予測、インター予測、残差変換、量子化、エントロピー符号化、ループフィルタにおいて新規ツール採用と改善点の解説
圧縮率の強化だけでなく、ハードウェア実装メーカーからの厳密な精の元、エントロピー符号化の簡素化(算術符号化エンジンシンボル216→8)、量子化ステップ定義の簡素化(カスタムテーブル→正確な指数関数)、変換処理の変更(バタフライ演算→行列乗算)など複雑性低減や並列処理最適化ハードウェア実装容易性も同時に実現しようとする試みも
👍
高評価
0
👎
低評価
0
72 ななしのよっしん
2025/10/14(火) 15:57:20 ID: WAGjC5H/A9
スライドを元に訂正補足
エントロピー符号化
AV1では16だった最大シンボル値を8に削減。
AV1の量子化設計
​q_index(QP): カスタムLUTで定義256レベル。8/10/12ビットAC/DCで異なるテーブルを使用。
AV2の新しい量子化器
​q_index(QP)の量子化ステップサイズ: 統一された指数関数公式マッピング
​調整: 10ビット、12ビットAC/DC修飾子はインデックス上のシフトとして処理。
​ステップサイズ: 24のq_indexごとに2倍に増加。
レベル数: 8/10/12ビットコンテンツに対して256/304/352レベル
​改善: より広い品質範囲をカバーするために範囲を拡
AV1の量子化行列(QM)
(省略しています。全て読むにはこのリンクをクリック!)
👍
高評価
0
👎
低評価
0
73 ななしのよっしん
2025/10/31(金) 03:27:36 ID: WAGjC5H/A9
👍
高評価
0
👎
低評価
0
74 ななしのよっしん
2025/12/06(土) 17:51:12 ID: WAGjC5H/A9
👍
高評価
0
👎
低評価
0
75 ななしのよっしん
2025/12/13(土) 16:31:15 ID: WAGjC5H/A9
ドルビー、次世代の視聴体験を実現する「Dolby Vision 2」発表
https://av.watch.impress.co.jp/docs/news/2044209.htmlexit
Dolby Vision 2対抗「HDR10+ ADVANCED」発表。Prime Videoで順次展開へ
https://av.watch.impress.co.jp/docs/news/2070980.htmlexit
👍
高評価
0
👎
低評価
0
76 ななしのよっしん
2025/12/20(土) 15:35:57 ID: WAGjC5H/A9
👍
高評価
0
👎
低評価
0
77 ななしのよっしん
2026/01/07(水) 19:09:21 ID: WAGjC5H/A9
Transform and Entropy Coding in AV2
https://arxiv.org/html/2601.02712v1exit
GoogleApple、​TencentMeta、​NetflixOPPO、Broadcom所属の研究者らによる共著論文
変換とエントロピー符号化設計の技術解説と符号化ゲイン推定
All Intra(静止画)設定で−7.1%(PSNR)、−9.7%(VMAF)
Random Access(ストリーミング)設定で−4.2%(PSNR)、−5.2%(VMAF)
Low Delay(リアルタイム)設定で−2.7%(PSNR)、−3.4%(VMAF)
デコーダの演算処理負荷を+5%以内、メモリ使用量を+0.5KB以内に抑えたらしい
👍
高評価
0
👎
低評価
0

ニコニコニューストピックス