論文の概要: Neural B-frame Video Compression with Bi-directional Reference Harmonization
- arxiv url: http://arxiv.org/abs/2511.08938v1
- Date: Thu, 13 Nov 2025 01:20:06 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-13 22:34:54.31383
- Title: Neural B-frame Video Compression with Bi-directional Reference Harmonization
- Title(参考訳): 双方向参照調和によるニューラルBフレーム映像圧縮
- Authors: Yuxi Liu, Dengchao Jin, Shuai Huo, Jiawen Gu, Chao Zhou, Huihui Bai, Ming Lu, Zhan Ma,
- Abstract要約: 本稿では、双方向参照調和ビデオ圧縮(BRHVC)という新しいBフレームビデオ圧縮手法を提案する。
BRHVCは、参照情報の利用を最適化するために、双方向モーションコンバージ(BMC)と双方向コンテキスト融合(BCF)を使用している。
実験結果から, BRHVCは従来のNVC法よりも優れていたことが示唆された。
- 参考スコア(独自算出の注目度): 50.067848395760755
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Neural video compression (NVC) has made significant progress in recent years, while neural B-frame video compression (NBVC) remains underexplored compared to P-frame compression. NBVC can adopt bi-directional reference frames for better compression performance. However, NBVC's hierarchical coding may complicate continuous temporal prediction, especially at some hierarchical levels with a large frame span, which could cause the contribution of the two reference frames to be unbalanced. To optimize reference information utilization, we propose a novel NBVC method, termed Bi-directional Reference Harmonization Video Compression (BRHVC), with the proposed Bi-directional Motion Converge (BMC) and Bi-directional Contextual Fusion (BCF). BMC converges multiple optical flows in motion compression, leading to more accurate motion compensation on a larger scale. Then BCF explicitly models the weights of reference contexts under the guidance of motion compensation accuracy. With more efficient motions and contexts, BRHVC can effectively harmonize bi-directional references. Experimental results indicate that our BRHVC outperforms previous state-of-the-art NVC methods, even surpassing the traditional coding, VTM-RA (under random access configuration), on the HEVC datasets. The source code is released at https://github.com/kwai/NVC.
- Abstract(参考訳): ニューラルビデオ圧縮(NVC)は近年大きな進歩を遂げているが、ニューラルBフレームビデオ圧縮(NBVC)はPフレーム圧縮と比較して未探索である。
NBVCは圧縮性能を向上させるために双方向参照フレームを採用することができる。
しかし、NBVCの階層的符号化は、特に大きなフレーム幅を持つ階層的なレベルにおいて、連続的な時間的予測を複雑にし、2つの参照フレームの寄与が不均衡になる可能性がある。
参照情報の活用を最適化するために,BMC (Bi-directional Motion Converge) とBCF (Bi-directional Contextual Fusion) を併用した,双方向参照調和ビデオ圧縮 (BRHVC) と呼ばれる新しいNBVC手法を提案する。
BMCは複数の光流を運動圧縮に収束させ、より大きなスケールでより正確な運動補償をもたらす。
次に、BCFは、動き補償精度のガイダンスに基づいて、参照コンテキストの重みを明示的にモデル化する。
より効率的な動きとコンテキストにより、BRHVCは双方向参照を効果的に調和させることができる。
実験結果から,BRHVCは従来の符号化手法であるVTM-RA(ランダムアクセス構成)をHEVCデータセット上で上回り,最先端のNVC手法よりも優れていたことが示唆された。
ソースコードはhttps://github.com/kwai/NVCで公開されている。
関連論文リスト
- Improved Video VAE for Latent Video Diffusion Model [55.818110540710215]
ビデオオートエンコーダ(VAE)は、ピクセルデータを低次元の潜在空間に圧縮することを目的としており、OpenAIのSoraで重要な役割を果たしている。
既存のVAEのほとんどは、時間空間圧縮のために3次元因果構造に事前訓練された画像VAEを注入する。
ビデオVAE(IV-VAE)をさらに改善するための新しいKTCアーキテクチャとGCConvモジュールを提案する。
論文 参考訳(メタデータ) (2024-11-10T12:43:38Z) - Bi-Directional Deep Contextual Video Compression [17.195099321371526]
本稿では,Bフレームに適した双方向深層映像圧縮方式をDCVC-Bと呼ぶ。
まず、効果的な動き差分符号化のための双方向の動き差分文脈伝搬法を提案する。
次に、双方向文脈圧縮モデルと対応する双方向時間エントロピーモデルを提案する。
第3に,階層的品質構造に基づくトレーニング戦略を提案し,画像の大規模なグループ間で効果的なビット割り当てを実現する。
論文 参考訳(メタデータ) (2024-08-16T08:45:25Z) - IBVC: Interpolation-driven B-frame Video Compression [68.18440522300536]
Bフレームビデオ圧縮は、双方向動作推定と動き補償(MEMC)符号化をミドルフレーム再構成に適用することを目的としている。
従来の学習アプローチでは、しばしば双方向の光フロー推定に依存するニューラルネットワークのPフレームコーデックをBフレームに直接拡張する。
これらの問題に対処するために,IBVC (Interpolation-B-frame Video Compression) という単純な構造を提案する。
論文 参考訳(メタデータ) (2023-09-25T02:45:51Z) - Perceptual Learned Video Compression with Recurrent Conditional GAN [158.0726042755]
本稿では, PVC (Perceptual Learned Video Compression) アプローチを提案する。
PLVCは低ビットレートで映像を知覚品質に圧縮することを学ぶ。
ユーザスタディでは、最新の学習ビデオ圧縮手法と比較して、PLVCの優れた知覚性能をさらに検証している。
論文 参考訳(メタデータ) (2021-09-07T13:36:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。