論文の概要: Content Adaptive and Error Propagation Aware Deep Video Compression
- arxiv url: http://arxiv.org/abs/2003.11282v1
- Date: Wed, 25 Mar 2020 09:04:24 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-20 03:40:56.043565
- Title: Content Adaptive and Error Propagation Aware Deep Video Compression
- Title(参考訳): ディープビデオ圧縮を考慮したコンテンツ適応とエラー伝搬
- Authors: Guo Lu, Chunlei Cai, Xiaoyun Zhang, Li Chen, Wanli Ouyang, Dong Xu,
Zhiyong Gao
- Abstract要約: 本稿では,コンテンツ適応型・誤り伝搬対応型ビデオ圧縮システムを提案する。
本手法では, 複数フレームの圧縮性能を1フレームではなく複数フレームで考慮し, 共同学習手法を用いる。
従来の圧縮システムでは手作りのコーディングモードを使用する代わりに,オンラインエンコーダ更新方式をシステム内に設計する。
- 参考スコア(独自算出の注目度): 110.31693187153084
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recently, learning based video compression methods attract increasing
attention. However, the previous works suffer from error propagation due to the
accumulation of reconstructed error in inter predictive coding. Meanwhile, the
previous learning based video codecs are also not adaptive to different video
contents. To address these two problems, we propose a content adaptive and
error propagation aware video compression system. Specifically, our method
employs a joint training strategy by considering the compression performance of
multiple consecutive frames instead of a single frame. Based on the learned
long-term temporal information, our approach effectively alleviates error
propagation in reconstructed frames. More importantly, instead of using the
hand-crafted coding modes in the traditional compression systems, we design an
online encoder updating scheme in our system. The proposed approach updates the
parameters for encoder according to the rate-distortion criterion but keeps the
decoder unchanged in the inference stage. Therefore, the encoder is adaptive to
different video contents and achieves better compression performance by
reducing the domain gap between the training and testing datasets. Our method
is simple yet effective and outperforms the state-of-the-art learning based
video codecs on benchmark datasets without increasing the model size or
decreasing the decoding speed.
- Abstract(参考訳): 近年,学習に基づくビデオ圧縮手法が注目されている。
しかし, 先行研究は, 予測符号化における再構成誤りの蓄積による誤り伝播に悩まされている。
一方、従来の学習ベースのビデオコーデックは、異なる映像コンテンツにも適応しない。
これら2つの問題に対処するために,コンテンツ適応型およびエラー伝搬型ビデオ圧縮システムを提案する。
具体的には,1フレームではなく,複数フレームの圧縮性能を考慮した共同学習手法を提案する。
学習した長期時間情報に基づいて,再構成されたフレームの誤り伝播を効果的に軽減する。
さらに重要なことは、従来の圧縮システムで手作りのコーディングモードを使う代わりに、オンラインエンコーダ更新スキームをシステム内に設計することです。
提案手法は, 速度歪み基準に従ってエンコーダのパラメータを更新するが, 推論段階でデコーダは変化しない。
したがって、エンコーダは異なるビデオコンテンツに適応し、トレーニングとテストデータセット間の領域ギャップを小さくすることで圧縮性能を向上させる。
本手法は, モデルサイズを増大させることなく, 復号速度を低下させることなく, ベンチマークデータセット上で, 最先端の学習ベースビデオコーデックより優れる。
関連論文リスト
- Accelerating Learned Video Compression via Low-Resolution Representation Learning [18.399027308582596]
低解像度表現学習に焦点を当てた学習ビデオ圧縮のための効率最適化フレームワークを提案する。
提案手法は,H.266参照ソフトウェアVTMの低遅延P構成と同等の性能を実現する。
論文 参考訳(メタデータ) (2024-07-23T12:02:57Z) - Prediction and Reference Quality Adaptation for Learned Video Compression [54.58691829087094]
本研究では,空間的およびチャネル的予測品質差の明確な識別を行うために,信頼度に基づく予測品質適応(PQA)モジュールを提案する。
また、参照品質適応(RQA)モジュールと関連する繰り返し学習戦略を提案し、様々な参照品質のための動的空間変化フィルタを提供する。
論文 参考訳(メタデータ) (2024-06-20T09:03:26Z) - Low-complexity Deep Video Compression with A Distributed Coding
Architecture [4.5885672744218]
一般的な予測符号化に基づくビデオ圧縮手法は、時間的冗長性を低減するために重エンコーダに依存している。
従来の分散コーディング手法は、予測的コーディングとはかなりのパフォーマンスギャップに悩まされている。
本稿では,レート歪み特性を改善するために,最初のエンドツーエンドの分散ビデオ圧縮フレームワークを提案する。
論文 参考訳(メタデータ) (2023-03-21T05:34:04Z) - Exploring Long- and Short-Range Temporal Information for Learned Video
Compression [54.91301930491466]
圧縮性能を高めるために,映像コンテンツの特徴を活かし,時間的情報を探究することに注力する。
本稿では,画像群(GOP)内で画像の推測中に連続的に更新できる時間前処理を提案する。
この場合、時間的事前は、現在のGOP内のすべてのデコードされた画像の貴重な時間的情報を含む。
本稿では,マルチスケール補償を実現する階層構造を設計する。
論文 参考訳(メタデータ) (2022-08-07T15:57:18Z) - A Coding Framework and Benchmark towards Low-Bitrate Video Understanding [63.05385140193666]
我々は,従来のコーデックとニューラルネットワーク(NN)の両方を活用する,従来型ニューラル混合符号化フレームワークを提案する。
このフレームワークは、動画の移動効率の良いセマンティック表現を確実に保持することで最適化される。
8つのデータセットに3つのダウンストリームタスクを備えた低ビットレートビデオ理解ベンチマークを構築し、このアプローチの顕著な優位性を実証した。
論文 参考訳(メタデータ) (2022-02-06T16:29:15Z) - Leveraging Bitstream Metadata for Fast, Accurate, Generalized Compressed
Video Quality Enhancement [74.1052624663082]
圧縮ビデオの細部を復元する深層学習アーキテクチャを開発した。
これにより,従来の圧縮補正法と比較して復元精度が向上することを示す。
我々は、ビットストリームで容易に利用できる量子化データに対して、我々のモデルを条件付けする。
論文 参考訳(メタデータ) (2022-01-31T18:56:04Z) - Conditional Entropy Coding for Efficient Video Compression [82.35389813794372]
本稿では,フレーム間の条件エントロピーをモデル化することのみに焦点を当てた,非常にシンプルで効率的なビデオ圧縮フレームワークを提案する。
まず、画像遅延符号間のエントロピーをモデル化する単純なアーキテクチャが、他のニューラルビデオ圧縮やビデオコーデックと同等の競争力を持つことを示す。
次に、このアーキテクチャの上に新しい内部学習拡張を提案し、復号速度を抑えることなく10%の節約を実現した。
論文 参考訳(メタデータ) (2020-08-20T20:01:59Z) - Variable Rate Video Compression using a Hybrid Recurrent Convolutional
Learning Framework [1.9290392443571382]
本稿では,予測自動符号化の概念に基づくハイブリッドビデオ圧縮フレームワークであるPredEncoderを提案する。
可変レートブロック符号化方式が論文で提案され,ビットレート比が著しく向上した。
論文 参考訳(メタデータ) (2020-04-08T20:49:25Z) - A Unified End-to-End Framework for Efficient Deep Image Compression [35.156677716140635]
本稿では,3つの新しい技術に基づくEDIC(Efficient Deep Image Compression)という統合フレームワークを提案する。
具体的には、学習に基づく画像圧縮のためのオートエンコーダスタイルのネットワークを設計する。
EDIC法は,映像圧縮性能を向上させるために,Deep Video Compression (DVC) フレームワークに容易に組み込むことができる。
論文 参考訳(メタデータ) (2020-02-09T14:21:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。