論文の概要: End-to-End Rate-Distortion Optimization for Bi-Directional Learned Video
Compression
- arxiv url: http://arxiv.org/abs/2008.05028v2
- Date: Wed, 26 May 2021 19:12:26 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-31 12:31:32.069970
- Title: End-to-End Rate-Distortion Optimization for Bi-Directional Learned Video
Compression
- Title(参考訳): 双方向学習ビデオ圧縮におけるエンドツーエンド速度歪み最適化
- Authors: M. Akin Yilmaz and A. Murat Tekalp
- Abstract要約: 学習されたビデオ圧縮は、すべての非線形モジュールのエンドツーエンドの速度歪みを最適化する訓練を可能にする。
本稿では,画像の固定サイズ群に対するコスト関数の蓄積による階層的,双方向な動きのエンドツーエンド最適化を初めて提案する。
- 参考スコア(独自算出の注目度): 10.404162481860634
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Conventional video compression methods employ a linear transform and block
motion model, and the steps of motion estimation, mode and quantization
parameter selection, and entropy coding are optimized individually due to
combinatorial nature of the end-to-end optimization problem. Learned video
compression allows end-to-end rate-distortion optimized training of all
nonlinear modules, quantization parameter and entropy model simultaneously.
While previous work on learned video compression considered training a
sequential video codec based on end-to-end optimization of cost averaged over
pairs of successive frames, it is well-known in conventional video compression
that hierarchical, bi-directional coding outperforms sequential compression. In
this paper, we propose for the first time end-to-end optimization of a
hierarchical, bi-directional motion compensated learned codec by accumulating
cost function over fixed-size groups of pictures (GOP). Experimental results
show that the rate-distortion performance of our proposed learned
bi-directional {\it GOP coder} outperforms the state-of-the-art end-to-end
optimized learned sequential compression as expected.
- Abstract(参考訳): 従来のビデオ圧縮手法では、線形変換とブロック運動モデルを用い、動作推定、モードおよび量子化パラメータの選択、エントロピー符号化の各ステップは、エンドツーエンド最適化問題の組合せの性質により個別に最適化される。
学習ビデオ圧縮は、すべての非線形モジュール、量子化パラメータ、エントロピーモデルを同時にエンドツーエンドのレートゆがめ最適化したトレーニングを可能にする。
学習ビデオ圧縮における従来の研究は,一対の連続フレームに対するコスト平均のエンドツーエンド最適化に基づくシーケンシャルビデオコーデックのトレーニングを検討したが,従来のビデオ圧縮では階層的な双方向符号化の方が逐次圧縮に優れていたことがよく知られている。
本稿では,画像の固定サイズグループ(GOP)に対するコスト関数の蓄積により,階層的かつ双方向な動き補償学習コーデックのエンドツーエンド最適化を初めて提案する。
実験結果から,提案した学習双方向GOPコーダの速度歪み性能は,最先端のエンドツーエンド最適化学習逐次圧縮よりも期待通りに優れていた。
関連論文リスト
- Multi-Scale Deformable Alignment and Content-Adaptive Inference for
Flexible-Rate Bi-Directional Video Compression [8.80688035831646]
本稿では、エンドツーエンドの速度歪みに最適化された階層的双方向ビデオ圧縮のための適応型モーション補正モデルを提案する。
我々はゲインユニットを使用し、単一のモデルが複数のレート歪み動作ポイントで動作できるようにする。
実験により, 学習ビデオ符号化における先行技術に比較して, 最先端の速度歪み性能を示すことができた。
論文 参考訳(メタデータ) (2023-06-28T20:32:16Z) - Learned Video Compression via Heterogeneous Deformable Compensation
Network [78.72508633457392]
不安定な圧縮性能の問題に対処するために,不均一変形補償戦略(HDCVC)を用いた学習ビデオ圧縮フレームワークを提案する。
より具体的には、提案アルゴリズムは隣接する2つのフレームから特徴を抽出し、コンテンツ近傍の不均一な変形(HetDeform)カーネルオフセットを推定する。
実験結果から,HDCVCは最近の最先端の学習ビデオ圧縮手法よりも優れた性能を示した。
論文 参考訳(メタデータ) (2022-07-11T02:31:31Z) - Flexible-Rate Learned Hierarchical Bi-Directional Video Compression With
Motion Refinement and Frame-Level Bit Allocation [8.80688035831646]
我々は、動き推定と予測モジュールを組み合わせ、改良された残留運動ベクトルを圧縮し、速度歪み性能を向上する。
我々は、ゲインユニットを利用して、コード内対双方向符号化フレーム間のビット割り当てを制御する。
論文 参考訳(メタデータ) (2022-06-27T20:18:52Z) - Coarse-to-fine Deep Video Coding with Hyperprior-guided Mode Prediction [50.361427832256524]
動き補償を改善するために,粗大なC2F(Deep Video compression framework)を提案する。
我々のC2Fフレームワークは、ビットコストを大幅に増大させることなく、より良い動き補償結果を得ることができる。
論文 参考訳(メタデータ) (2022-06-15T11:38:53Z) - Neural Data-Dependent Transform for Learned Image Compression [72.86505042102155]
ニューラルデータに依存した変換を構築し,各画像の符号化効率を最適化する連続オンラインモード決定機構を導入する。
実験の結果,提案したニューラルシンタクス設計と連続オンラインモード決定機構の有効性が示された。
論文 参考訳(メタデータ) (2022-03-09T14:56:48Z) - Neural JPEG: End-to-End Image Compression Leveraging a Standard JPEG
Encoder-Decoder [73.48927855855219]
本稿では,エンコーダとデコーダの両端に内在するニューラル表現を強化することで,符号化性能の向上を図るシステムを提案する。
実験により,提案手法はJPEGに対する速度歪み性能を,様々な品質指標で改善することを示した。
論文 参考訳(メタデータ) (2022-01-27T20:20:03Z) - End-to-End Rate-Distortion Optimized Learned Hierarchical Bi-Directional
Video Compression [10.885590093103344]
学習VCは、非線形変換、運動、エントロピーモデルのエンドツーエンドの速度歪み(R-D)最適化トレーニングを同時に行うことができる。
本稿では,階層型モーションサンプリングとエンドツーエンド最適化の利点を組み合わせた,学習型階層型双方向ビデオ(LHBDC)を提案する。
論文 参考訳(メタデータ) (2021-12-17T14:30:22Z) - End-to-end Neural Video Coding Using a Compound Spatiotemporal
Representation [33.54844063875569]
本稿では,2つの手法により生成された予測を適応的に組み合わせたハイブリッド動作補償法を提案する。
具体的には、リカレント情報集約(RIA)モジュールを用いて、複合時間表現(STR)を生成する。
さらに、ベクトルベースの再サンプリング、適応カーネルベースの再サンプリング、補償モード選択マップ、テクスチャ拡張を含む、CSTRから複数の予測を生成する1対多デコーダパイプラインを設計する。
論文 参考訳(メタデータ) (2021-08-05T19:43:32Z) - Substitutional Neural Image Compression [48.20906717052056]
置換型ニューラルイメージ圧縮(snic)は、あらゆるニューラルイメージ圧縮モデルを強化する一般的なアプローチである。
フレキシブルな歪みメトリックに向けて圧縮性能を高め、単一のモデルインスタンスを使用したビットレート制御を可能にする。
論文 参考訳(メタデータ) (2021-05-16T20:53:31Z) - Content Adaptive and Error Propagation Aware Deep Video Compression [110.31693187153084]
本稿では,コンテンツ適応型・誤り伝搬対応型ビデオ圧縮システムを提案する。
本手法では, 複数フレームの圧縮性能を1フレームではなく複数フレームで考慮し, 共同学習手法を用いる。
従来の圧縮システムでは手作りのコーディングモードを使用する代わりに,オンラインエンコーダ更新方式をシステム内に設計する。
論文 参考訳(メタデータ) (2020-03-25T09:04:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。