論文の概要: EHVC: Efficient Hierarchical Reference and Quality Structure for Neural Video Coding
- arxiv url: http://arxiv.org/abs/2509.04118v1
- Date: Thu, 04 Sep 2025 11:31:12 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-05 20:21:10.14333
- Title: EHVC: Efficient Hierarchical Reference and Quality Structure for Neural Video Coding
- Title(参考訳): EHVC:ニューラルビデオ符号化における効率的な階層的参照と品質構造
- Authors: Junqi Liao, Yaojun Wu, Chaoyi Lin, Zhipin Deng, Li Li, Dong Liu, Xiaoyan Sun,
- Abstract要約: EHVCは、3つの重要なイノベーションを持つ効率的な階層型ニューラルビデオである。
EHVCは最先端のNVCよりもはるかに優れた性能を発揮する。
- 参考スコア(独自算出の注目度): 15.336112685133907
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Neural video codecs (NVCs), leveraging the power of end-to-end learning, have demonstrated remarkable coding efficiency improvements over traditional video codecs. Recent research has begun to pay attention to the quality structures in NVCs, optimizing them by introducing explicit hierarchical designs. However, less attention has been paid to the reference structure design, which fundamentally should be aligned with the hierarchical quality structure. In addition, there is still significant room for further optimization of the hierarchical quality structure. To address these challenges in NVCs, we propose EHVC, an efficient hierarchical neural video codec featuring three key innovations: (1) a hierarchical multi-reference scheme that draws on traditional video codec design to align reference and quality structures, thereby addressing the reference-quality mismatch; (2) a lookahead strategy to utilize an encoder-side context from future frames to enhance the quality structure; (3) a layer-wise quality scale with random quality training strategy to stabilize quality structures during inference. With these improvements, EHVC achieves significantly superior performance to the state-of-the-art NVCs. Code will be released in: https://github.com/bytedance/NEVC.
- Abstract(参考訳): エンドツーエンド学習のパワーを活用するニューラルビデオコーデック(NVC)は、従来のビデオコーデックよりも顕著なコーディング効率の向上を実証している。
最近の研究は、NVCの品質構造に注意を払っており、明示的な階層的設計を導入して最適化している。
しかし、基本的には階層的な品質構造と整合していなければならない基準構造設計にはあまり注意が払われていない。
さらに、階層的な品質構造をさらに最適化する余地がまだ残っている。
NVCにおけるこれらの課題に対処するため,1) 従来のビデオコーデック設計に基づいて参照と品質構造を整合させ,参照品質のミスマッチに対処する階層的マルチ参照スキーム,2) 将来のフレームからエンコーダ側コンテキストを活用して品質構造を向上するルックアヘッド戦略,3) 推論中の品質構造を安定化するための階層的品質尺度,の3つの重要な革新を特徴とする効率的な階層型ニューラルビデオコーデックであるEHVCを提案する。
これらの改良により、EHVCは最先端のNVCよりも大幅に優れた性能を発揮する。
コードは、https://github.com/bytedance/NEVC.comでリリースされる。
関連論文リスト
- IQPFR: An Image Quality Prior for Blind Face Restoration and Beyond [56.99331967165238]
Blind Face Restoration (BFR)は、劣化した低品質(LQ)の顔画像を高品質(HQ)の出力に再構成する課題に対処する。
本研究では,非参照画像品質評価(NR-IQA)モデルから得られた画像品質優先(IQP)を組み込んだ新しいフレームワークを提案する。
提案手法は,複数のベンチマークにおいて最先端技術より優れている。
論文 参考訳(メタデータ) (2025-03-12T11:39:51Z) - EVEv2: Improved Baselines for Encoder-Free Vision-Language Models [72.07868838411474]
既存のエンコーダフリービジョン言語モデル(VLM)は、エンコーダベースモデルと性能ギャップを狭めている。
我々は,主流のエンコーダをベースとしたVLMと競合するエンコーダフリーVLMの効率的な戦略を開発する。
統一モデルにおいて、視覚と言語を適切に階層的に関連付けることで、モダリティ間の干渉を減少させることを示す。
論文 参考訳(メタデータ) (2025-02-10T18:59:58Z) - Compression-Realized Deep Structural Network for Video Quality Enhancement [78.13020206633524]
本稿では,圧縮ビデオの品質向上の課題に焦点をあてる。
既存の手法のほとんどは、圧縮コーデック内での事前処理を最適に活用するための構造設計を欠いている。
新しいパラダイムは、より意識的な品質向上プロセスのために緊急に必要である。
論文 参考訳(メタデータ) (2024-05-10T09:18:17Z) - Neural Video Compression with Feature Modulation [28.105412445443697]
条件付き符号化ベースニューラルビデオ(NVC)は、一般的に使用される残留符号化ベースニューラルビデオ(NVC)よりも優れていることを示す
本稿では,特徴変調による2つの重要な問題を解くための,条件付き符号化に基づく強力なNVCを提案する。
論文 参考訳(メタデータ) (2024-02-27T11:08:51Z) - Neural Video Compression with Temporal Layer-Adaptive Hierarchical
B-frame Coding [5.8550373172233305]
時間層適応最適化を用いた階層的Bフレーム符号化を用いたNVCモデルを提案する。
このモデルはベースラインに対して-39.86%のBDレートを達成している。
また、単純な双方向拡張よりも最大-49.13%のBDレートゲインを持つ大きなあるいは複雑な動きを持つシーケンスの課題も解決する。
論文 参考訳(メタデータ) (2023-08-30T06:49:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。