論文の概要: Residual Learning and Filtering Networks for End-to-End Lossless Video Compression
- arxiv url: http://arxiv.org/abs/2503.08819v1
- Date: Tue, 11 Mar 2025 18:51:36 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-13 15:38:50.367332
- Title: Residual Learning and Filtering Networks for End-to-End Lossless Video Compression
- Title(参考訳): エンド・ツー・エンド・エンド・ロスレスビデオ圧縮のための残差学習とフィルタリングネットワーク
- Authors: Md baharul Islam, Afsana Ahsan Jeny,
- Abstract要約: 既存の学習に基づくビデオ圧縮手法は、不正確な動き推定と不適切な動き補償構造に関連する課題に直面している。
本研究は,複数のキー操作を組み込んだエンドツーエンドビデオ圧縮手法を提案する。
提案手法は,映像圧縮における正確な動き推定と動き補償の課題に対処する。
- 参考スコア(独自算出の注目度): 3.0770091134672586
- License:
- Abstract: Existing learning-based video compression methods still face challenges related to inaccurate motion estimates and inadequate motion compensation structures. These issues result in compression errors and a suboptimal rate-distortion trade-off. To address these challenges, this work presents an end-to-end video compression method that incorporates several key operations. Specifically, we propose an autoencoder-type network with a residual skip connection to efficiently compress motion information. Additionally, we design motion vector and residual frame filtering networks to mitigate compression errors in the video compression system. To improve the effectiveness of the motion compensation network, we utilize powerful nonlinear transforms, such as the Parametric Rectified Linear Unit (PReLU), to delve deeper into the motion compensation architecture. Furthermore, a buffer is introduced to fine-tune the previous reference frames, thereby enhancing the reconstructed frame quality. These modules are combined with a carefully designed loss function that assesses the trade-off and enhances the overall video quality of the decoded output. Experimental results showcase the competitive performance of our method on various datasets, including HEVC (sequences B, C, and D), UVG, VTL, and MCL-JCV. The proposed approach tackles the challenges of accurate motion estimation and motion compensation in video compression, and the results highlight its competitive performance compared to existing methods.
- Abstract(参考訳): 既存の学習に基づくビデオ圧縮手法は、不正確な動き推定や不適切な動き補償構造に関連する課題に直面している。
これらの問題は、圧縮エラーと、最適速度歪みのトレードオフをもたらす。
これらの課題に対処するため、本研究では、いくつかの重要な操作を組み込んだエンドツーエンドのビデオ圧縮手法を提案する。
具体的には、動作情報を効率よく圧縮する残差スキップ接続を有するオートエンコーダ型ネットワークを提案する。
さらに,ビデオ圧縮システムにおける圧縮誤差を軽減するために,動きベクトルと残差フレームフィルタリングネットワークを設計する。
運動補償ネットワークの有効性を向上させるために,パラメトリック整流線形ユニット(PReLU)などの非線形変換を用いて,運動補償アーキテクチャを深く掘り下げる。
さらに、バッファを導入して、前の参照フレームを微調整し、再構成されたフレーム品質を向上させる。
これらのモジュールは、トレードオフを評価し、デコードされた出力の全体的なビデオ品質を向上させる、慎重に設計された損失関数と組み合わせられる。
実験の結果,HEVC(B,C,D),UVG,VTL,MCL-JCVなど,様々なデータセット上での本手法の競合性能が示された。
提案手法は,映像圧縮における正確な動き推定と動き補償の課題に対処し,既存の手法と比較して,その競合性能を強調した。
関連論文リスト
- IBVC: Interpolation-driven B-frame Video Compression [68.18440522300536]
Bフレームビデオ圧縮は、双方向動作推定と動き補償(MEMC)符号化をミドルフレーム再構成に適用することを目的としている。
従来の学習アプローチでは、しばしば双方向の光フロー推定に依存するニューラルネットワークのPフレームコーデックをBフレームに直接拡張する。
これらの問題に対処するために,IBVC (Interpolation-B-frame Video Compression) という単純な構造を提案する。
論文 参考訳(メタデータ) (2023-09-25T02:45:51Z) - Differentiable Resolution Compression and Alignment for Efficient Video
Classification and Retrieval [16.497758750494537]
本稿では,高解像度圧縮・アライメント機構を備えた効率的な映像表現ネットワークを提案する。
我々は、相性および非相性フレーム特徴を符号化するために、微分可能なコンテキスト対応圧縮モジュールを利用する。
我々は,異なる解像度のフレーム特徴間のグローバル時間相関を捉えるために,新しい解像度変換器層を導入する。
論文 参考訳(メタデータ) (2023-09-15T05:31:53Z) - Improving Multi-generation Robustness of Learned Image Compression [16.86614420872084]
ネットワーク構造を変更せずに50回再符号化しても,BPGの最初の圧縮に匹敵する性能が得られることを示す。
論文 参考訳(メタデータ) (2022-10-31T03:26:11Z) - Learned Video Compression via Heterogeneous Deformable Compensation
Network [78.72508633457392]
不安定な圧縮性能の問題に対処するために,不均一変形補償戦略(HDCVC)を用いた学習ビデオ圧縮フレームワークを提案する。
より具体的には、提案アルゴリズムは隣接する2つのフレームから特徴を抽出し、コンテンツ近傍の不均一な変形(HetDeform)カーネルオフセットを推定する。
実験結果から,HDCVCは最近の最先端の学習ビデオ圧縮手法よりも優れた性能を示した。
論文 参考訳(メタデータ) (2022-07-11T02:31:31Z) - Reducing Redundancy in the Bottleneck Representation of the Autoencoders [98.78384185493624]
オートエンコーダは教師なしニューラルネットワークの一種であり、様々なタスクを解くのに使用できる。
本稿では,ボトルネック表現における特徴冗長性を明示的に罰する手法を提案する。
我々は,3つの異なるデータセットを用いた次元削減,MNISTデータセットを用いた画像圧縮,ファッションMNISTを用いた画像デノナイズという,さまざまなタスクにまたがってアプローチを検証した。
論文 参考訳(メタデータ) (2022-02-09T18:48:02Z) - FVC: A New Framework towards Deep Video Compression in Feature Space [21.410266039564803]
特徴空間におけるすべての主要な操作(動き推定、動き圧縮、動き補償、残差圧縮)を実行することで特徴空間ビデオ符号化ネットワーク(FVC)を提案する。
提案フレームワークは,HEVC,UVG,VTL,MCL-JCVを含む4つのベンチマークデータセットに対して,最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2021-05-20T08:55:32Z) - COMISR: Compression-Informed Video Super-Resolution [76.94152284740858]
ウェブやモバイルデバイスのほとんどのビデオは圧縮され、帯域幅が制限されると圧縮は厳しい。
圧縮によるアーティファクトを導入せずに高解像度コンテンツを復元する圧縮インフォームドビデオ超解像モデルを提案する。
論文 参考訳(メタデータ) (2021-05-04T01:24:44Z) - Super-Resolving Compressed Video in Coding Chain [27.994055823226848]
レファレンスベースのDCNNと連携する混合解像度符号化フレームワークを提案する。
この新しい符号化チェーンにおいて、基準ベースDCNNは、低解像度(LR)圧縮ビデオからデコーダ側の高解像度(HR)クリーンバージョンへの直接マッピングを学習する。
論文 参考訳(メタデータ) (2021-03-26T03:39:54Z) - Content Adaptive and Error Propagation Aware Deep Video Compression [110.31693187153084]
本稿では,コンテンツ適応型・誤り伝搬対応型ビデオ圧縮システムを提案する。
本手法では, 複数フレームの圧縮性能を1フレームではなく複数フレームで考慮し, 共同学習手法を用いる。
従来の圧縮システムでは手作りのコーディングモードを使用する代わりに,オンラインエンコーダ更新方式をシステム内に設計する。
論文 参考訳(メタデータ) (2020-03-25T09:04:24Z) - Video Face Super-Resolution with Motion-Adaptive Feedback Cell [90.73821618795512]
深部畳み込みニューラルネットワーク(CNN)の発展により,ビデオ超解像法(VSR)は近年,顕著な成功を収めている。
本稿では,動作補償を効率的に捕捉し,適応的にネットワークにフィードバックする,シンプルで効果的なブロックである動き適応型フィードバックセル(MAFC)を提案する。
論文 参考訳(メタデータ) (2020-02-15T13:14:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。