論文の概要: Deep Contextual Video Compression
- arxiv url: http://arxiv.org/abs/2109.15047v1
- Date: Thu, 30 Sep 2021 12:14:24 GMT
- ステータス: 処理完了
- システム内更新日: 2021-10-01 14:34:54.783776
- Title: Deep Contextual Video Compression
- Title(参考訳): ディープコンテクストビデオ圧縮
- Authors: Jiahao Li, Bin Li, Yan Lu
- Abstract要約: 本稿では,予測符号化から条件付き符号化へのパラダイムシフトを実現するための,深い文脈ビデオ圧縮フレームワークを提案する。
提案手法は従来のSOTA(State-of-theart)ディープビデオ圧縮法よりも大幅に優れる。
- 参考スコア(独自算出の注目度): 20.301569390401102
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Most of the existing neural video compression methods adopt the predictive
coding framework, which first generates the predicted frame and then encodes
its residue with the current frame. However, as for compression ratio,
predictive coding is only a sub-optimal solution as it uses simple subtraction
operation to remove the redundancy across frames. In this paper, we propose a
deep contextual video compression framework to enable a paradigm shift from
predictive coding to conditional coding. In particular, we try to answer the
following questions: how to define, use, and learn condition under a deep video
compression framework. To tap the potential of conditional coding, we propose
using feature domain context as condition. This enables us to leverage the high
dimension context to carry rich information to both the encoder and the
decoder, which helps reconstruct the high-frequency contents for higher video
quality. Our framework is also extensible, in which the condition can be
flexibly designed. Experiments show that our method can significantly
outperform the previous state-of-the-art (SOTA) deep video compression methods.
When compared with x265 using veryslow preset, we can achieve 26.0% bitrate
saving for 1080P standard test videos.
- Abstract(参考訳): 既存のニューラルビデオ圧縮手法の多くは予測符号化フレームワークを採用しており、予測されたフレームを最初に生成し、その残差を現在のフレームでエンコードする。
しかし、圧縮比については、フレーム間の冗長性を取り除くために単純な減算演算を用いるため、予測符号化は副最適解に過ぎない。
本稿では,予測符号化から条件符号化へのパラダイムシフトを可能にする深層映像圧縮フレームワークを提案する。
特に、ディープビデオ圧縮フレームワークの下で条件をどのように定義、使用、学習するか、という疑問に答えようとしている。
条件付きコーディングの可能性を活用するために,特徴領域コンテキストを条件として使用することを提案する。
これにより、高次元のコンテキストを利用してエンコーダとデコーダの両方にリッチな情報を運ぶことができ、高周波数コンテンツを高画質に再構成するのに役立つ。
私たちのフレームワークも拡張可能で、条件を柔軟に設計することができます。
実験により,本手法は,従来のsota (state-of-the-art) 深部映像圧縮法を大きく上回ることを示した。
非常に遅いプリセットを使用したx265と比較すると、1080P標準テストビデオのビットレートを26.0%削減できる。
関連論文リスト
- Accelerating Learned Video Compression via Low-Resolution Representation Learning [18.399027308582596]
低解像度表現学習に焦点を当てた学習ビデオ圧縮のための効率最適化フレームワークを提案する。
提案手法は,H.266参照ソフトウェアVTMの低遅延P構成と同等の性能を実現する。
論文 参考訳(メタデータ) (2024-07-23T12:02:57Z) - Predictive Coding For Animation-Based Video Compression [13.161311799049978]
本稿では,画像アニメーションを予測器として用いる予測符号化手法を提案し,実際の対象フレームに対する残差を符号化する。
実験の結果,HEVCビデオ標準に比べて70%以上,VVCに比べて30%以上,有意な上昇を示した。
論文 参考訳(メタデータ) (2023-07-09T14:40:54Z) - Advancing Learned Video Compression with In-loop Frame Prediction [177.67218448278143]
本稿では,ループ内フレーム予測モジュールを用いたALVC(Advanced Learned Video Compression)アプローチを提案する。
予測フレームは、以前圧縮されたフレームよりも優れた参照として機能し、圧縮性能の恩恵を受けることができる。
本実験は,学習ビデオ圧縮におけるALVC手法の最先端性能を示すものである。
論文 参考訳(メタデータ) (2022-11-13T19:53:14Z) - Leveraging Bitstream Metadata for Fast, Accurate, Generalized Compressed
Video Quality Enhancement [74.1052624663082]
圧縮ビデオの細部を復元する深層学習アーキテクチャを開発した。
これにより,従来の圧縮補正法と比較して復元精度が向上することを示す。
我々は、ビットストリームで容易に利用できる量子化データに対して、我々のモデルを条件付けする。
論文 参考訳(メタデータ) (2022-01-31T18:56:04Z) - Microdosing: Knowledge Distillation for GAN based Compression [18.140328230701233]
そこで本研究では,知識蒸留を利用した画像デコーダの有効化について,元のパラメータ数のごく一部で示す。
これにより、モデルサイズを20倍に削減し、デコード時間の50%削減を実現できます。
論文 参考訳(メタデータ) (2022-01-07T14:27:16Z) - COMISR: Compression-Informed Video Super-Resolution [76.94152284740858]
ウェブやモバイルデバイスのほとんどのビデオは圧縮され、帯域幅が制限されると圧縮は厳しい。
圧縮によるアーティファクトを導入せずに高解像度コンテンツを復元する圧縮インフォームドビデオ超解像モデルを提案する。
論文 参考訳(メタデータ) (2021-05-04T01:24:44Z) - Conditional Entropy Coding for Efficient Video Compression [82.35389813794372]
本稿では,フレーム間の条件エントロピーをモデル化することのみに焦点を当てた,非常にシンプルで効率的なビデオ圧縮フレームワークを提案する。
まず、画像遅延符号間のエントロピーをモデル化する単純なアーキテクチャが、他のニューラルビデオ圧縮やビデオコーデックと同等の競争力を持つことを示す。
次に、このアーキテクチャの上に新しい内部学習拡張を提案し、復号速度を抑えることなく10%の節約を実現した。
論文 参考訳(メタデータ) (2020-08-20T20:01:59Z) - Content Adaptive and Error Propagation Aware Deep Video Compression [110.31693187153084]
本稿では,コンテンツ適応型・誤り伝搬対応型ビデオ圧縮システムを提案する。
本手法では, 複数フレームの圧縮性能を1フレームではなく複数フレームで考慮し, 共同学習手法を用いる。
従来の圧縮システムでは手作りのコーディングモードを使用する代わりに,オンラインエンコーダ更新方式をシステム内に設計する。
論文 参考訳(メタデータ) (2020-03-25T09:04:24Z) - Learning for Video Compression with Hierarchical Quality and Recurrent
Enhancement [164.7489982837475]
本稿では,階層型ビデオ圧縮(HLVC)手法を提案する。
我々のHLVCアプローチでは、エンコーダ側とデコーダ側の低品質フレームの圧縮と強化を容易にするため、階層的品質は符号化効率の恩恵を受ける。
論文 参考訳(メタデータ) (2020-03-04T09:31:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。