論文の概要: Content Adaptive based Motion Alignment Framework for Learned Video Compression
- arxiv url: http://arxiv.org/abs/2512.12936v1
- Date: Mon, 15 Dec 2025 02:51:47 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-16 17:54:56.513058
- Title: Content Adaptive based Motion Alignment Framework for Learned Video Compression
- Title(参考訳): 学習ビデオ圧縮のためのコンテンツ適応型モーションアライメントフレームワーク
- Authors: Tiange Zhang, Xiandong Meng, Siwei Ma,
- Abstract要約: 本稿では,コンテンツ適応型モーションアライメントフレームワークを提案する。
まず、粗いオフセット予測とマスク変調により動き補償を洗練させる2段階の流動誘導変形防止機構を導入する。
第2に,基準品質に基づいて歪み重みを調整するマルチ参照品質認識戦略を提案する。
第3に,スムーズな動き推定を得るために,フレームを大きさと解像度でダウンサンプルするトレーニングフリーモジュールを統合する。
- 参考スコア(独自算出の注目度): 72.13599533975413
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recent advances in end-to-end video compression have shown promising results owing to their unified end-to-end learning optimization. However, such generalized frameworks often lack content-specific adaptation, leading to suboptimal compression performance. To address this, this paper proposes a content adaptive based motion alignment framework that improves performance by adapting encoding strategies to diverse content characteristics. Specifically, we first introduce a two-stage flow-guided deformable warping mechanism that refines motion compensation with coarse-to-fine offset prediction and mask modulation, enabling precise feature alignment. Second, we propose a multi-reference quality aware strategy that adjusts distortion weights based on reference quality, and applies it to hierarchical training to reduce error propagation. Third, we integrate a training-free module that downsamples frames by motion magnitude and resolution to obtain smooth motion estimation. Experimental results on standard test datasets demonstrate that our framework CAMA achieves significant improvements over state-of-the-art Neural Video Compression models, achieving a 24.95% BD-rate (PSNR) savings over our baseline model DCVC-TCM, while also outperforming reproduced DCVC-DC and traditional codec HM-16.25.
- Abstract(参考訳): エンドツーエンドビデオ圧縮の最近の進歩は、エンド・ツー・エンドの学習最適化による有望な結果を示している。
しかし、そのような一般化されたフレームワークは、しばしばコンテンツ固有の適応を欠き、最適化された圧縮性能をもたらす。
そこで本研究では,多種多様なコンテンツ特性に符号化戦略を適用することにより,パフォーマンスを向上させるコンテンツ適応型モーションアライメントフレームワークを提案する。
具体的には、まず、粗いオフセット予測とマスク変調により動き補償を洗練し、正確な特徴調整を可能にする2段階の流動誘導変形防止機構を導入する。
第2に,基準品質に基づいて歪み重みを調整するマルチ参照品質認識戦略を提案する。
第3に,スムーズな動き推定を得るために,フレームを大きさと解像度でダウンサンプルするトレーニングフリーモジュールを統合する。
標準テストデータセットによる実験結果から,我々のフレームワークCAMAは最先端のニューラルビデオ圧縮モデルよりも大幅に向上し,ベースラインモデルDCVC-TCMよりも24.95%のBDレート(PSNR)の節約を実現し,また再生されたDCVC-DCや従来のコーデックHM-16.25よりも優れていた。
関連論文リスト
- Residual Learning and Filtering Networks for End-to-End Lossless Video Compression [3.0770091134672586]
既存の学習に基づくビデオ圧縮手法は、不正確な動き推定と不適切な動き補償構造に関連する課題に直面している。
本研究は,複数のキー操作を組み込んだエンドツーエンドビデオ圧縮手法を提案する。
提案手法は,映像圧縮における正確な動き推定と動き補償の課題に対処する。
論文 参考訳(メタデータ) (2025-03-11T18:51:36Z) - Compression-Realized Deep Structural Network for Video Quality Enhancement [78.13020206633524]
本稿では,圧縮ビデオの品質向上の課題に焦点をあてる。
既存の手法のほとんどは、圧縮コーデック内での事前処理を最適に活用するための構造設計を欠いている。
新しいパラダイムは、より意識的な品質向上プロセスのために緊急に必要である。
論文 参考訳(メタデータ) (2024-05-10T09:18:17Z) - Multi-Scale Deformable Alignment and Content-Adaptive Inference for
Flexible-Rate Bi-Directional Video Compression [8.80688035831646]
本稿では、エンドツーエンドの速度歪みに最適化された階層的双方向ビデオ圧縮のための適応型モーション補正モデルを提案する。
我々はゲインユニットを使用し、単一のモデルが複数のレート歪み動作ポイントで動作できるようにする。
実験により, 学習ビデオ符号化における先行技術に比較して, 最先端の速度歪み性能を示すことができた。
論文 参考訳(メタデータ) (2023-06-28T20:32:16Z) - Content-Adaptive Motion Rate Adaption for Learned Video Compression [11.574465203875342]
本稿では,学習ビデオ圧縮のためのオンラインモーションレート適応方式を提案する。
個々のテストシーケンスにおけるコンテンツ適応型コーディングを実現し、トレーニングとテストデータのドメインギャップを軽減することを目的としている。
パッチレベルのビット割り当てマップは$alpha$-mapと呼ばれ、動きのビットレートとフレーム間符号化のトレードオフを行う。
論文 参考訳(メタデータ) (2023-02-13T11:51:23Z) - Learned Video Compression via Heterogeneous Deformable Compensation
Network [78.72508633457392]
不安定な圧縮性能の問題に対処するために,不均一変形補償戦略(HDCVC)を用いた学習ビデオ圧縮フレームワークを提案する。
より具体的には、提案アルゴリズムは隣接する2つのフレームから特徴を抽出し、コンテンツ近傍の不均一な変形(HetDeform)カーネルオフセットを推定する。
実験結果から,HDCVCは最近の最先端の学習ビデオ圧縮手法よりも優れた性能を示した。
論文 参考訳(メタデータ) (2022-07-11T02:31:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。