論文の概要: Conditional Coding and Variable Bitrate for Practical Learned Video
Coding
- arxiv url: http://arxiv.org/abs/2104.09103v2
- Date: Tue, 20 Apr 2021 09:28:17 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-03 05:00:36.881425
- Title: Conditional Coding and Variable Bitrate for Practical Learned Video
Coding
- Title(参考訳): 実地学習ビデオ符号化のための条件付き符号化と可変ビットレート
- Authors: Th\'eo Ladune (IETR), Pierrick Philippe, Wassim Hamidouche (IETR), Lu
Zhang (IETR), Olivier D\'eforges (IETR)
- Abstract要約: 条件符号化と量子化ゲインベクトルは、単一のエンコーダ/デコーダペアに柔軟性を提供するために使用される。
提案手法はHEVCと同等の性能を示す。
- 参考スコア(独自算出の注目度): 1.6619384554007748
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper introduces a practical learned video codec. Conditional coding and
quantization gain vectors are used to provide flexibility to a single
encoder/decoder pair, which is able to compress video sequences at a variable
bitrate. The flexibility is leveraged at test time by choosing the rate and GOP
structure to optimize a rate-distortion cost. Using the CLIC21 video test
conditions, the proposed approach shows performance on par with HEVC.
- Abstract(参考訳): 本稿では,実用的な学習ビデオコーデックを提案する。
条件付き符号化と量子化ゲインベクトルは、可変ビットレートでビデオシーケンスを圧縮できる単一のエンコーダ/デコーダペアに柔軟性を与えるために使用される。
フレキシビリティは、レートとGOP構造を選択して、レート歪曲コストを最適化することで、テスト時に活用される。
CLIC21ビデオテスト条件を用いて、提案手法はHEVCと同等のパフォーマンスを示す。
関連論文リスト
- When Video Coding Meets Multimodal Large Language Models: A Unified Paradigm for Video Coding [112.44822009714461]
CMVC(Cross-Modality Video Coding)は、ビデオ符号化における多モード表現とビデオ生成モデルを探索する先駆的な手法である。
復号化の際には、以前に符号化されたコンポーネントとビデオ生成モデルを利用して複数の復号モードを生成する。
TT2Vは効果的な意味再構成を実現し,IT2Vは競争力のある知覚整合性を示した。
論文 参考訳(メタデータ) (2024-08-15T11:36:18Z) - Prediction and Reference Quality Adaptation for Learned Video Compression [54.58691829087094]
本研究では,空間的およびチャネル的予測品質差の明確な識別を行うために,信頼度に基づく予測品質適応(PQA)モジュールを提案する。
また、参照品質適応(RQA)モジュールと関連する繰り返し学習戦略を提案し、様々な参照品質のための動的空間変化フィルタを提供する。
論文 参考訳(メタデータ) (2024-06-20T09:03:26Z) - Video Compression with Arbitrary Rescaling Network [8.489428003916622]
符号化前のビデオリサイズのためのレート誘導任意再スケーリングネットワーク(RARN)を提案する。
軽量RARN構造は、FHD(1080p)コンテンツをリアルタイム(91 FPS)で処理し、かなりのレート低下を得ることができる。
論文 参考訳(メタデータ) (2023-06-07T07:15:18Z) - Flexible Neural Image Compression via Code Editing [8.499248314440557]
ニューラル画像圧縮(NIC)は、レート歪み(R-D)性能において従来の画像コーデックよりも優れていた。
通常、R-D曲線の各点に専用エンコーダとデコーダのペアが必要であるため、実際の展開を妨げている。
本稿では,セミアモタイズされた推論と適応量子化に基づくNICの高フレキシブルな符号化手法であるCode Editingを提案する。
論文 参考訳(メタデータ) (2022-09-19T09:41:43Z) - CANF-VC: Conditional Augmented Normalizing Flows for Video Compression [81.41594331948843]
CANF-VCは、エンドツーエンドの学習ベースのビデオ圧縮システムである。
条件付き拡張正規化フロー(ANF)に基づく。
論文 参考訳(メタデータ) (2022-07-12T04:53:24Z) - Flexible-Rate Learned Hierarchical Bi-Directional Video Compression With
Motion Refinement and Frame-Level Bit Allocation [8.80688035831646]
我々は、動き推定と予測モジュールを組み合わせ、改良された残留運動ベクトルを圧縮し、速度歪み性能を向上する。
我々は、ゲインユニットを利用して、コード内対双方向符号化フレーム間のビット割り当てを制御する。
論文 参考訳(メタデータ) (2022-06-27T20:18:52Z) - Efficient VVC Intra Prediction Based on Deep Feature Fusion and
Probability Estimation [57.66773945887832]
本稿では,フレーム内予測におけるVersatile Video Coding (VVC) の複雑性を,深層融合と確率推定の2段階のフレームワークを用いて最適化することを提案する。
特に高精細度(HD)および超高精細度(UHD)ビデオシーケンスにおいて,提案手法の優位性を示す実験結果が得られた。
論文 参考訳(メタデータ) (2022-05-07T08:01:32Z) - End-to-End Rate-Distortion Optimized Learned Hierarchical Bi-Directional
Video Compression [10.885590093103344]
学習VCは、非線形変換、運動、エントロピーモデルのエンドツーエンドの速度歪み(R-D)最適化トレーニングを同時に行うことができる。
本稿では,階層型モーションサンプリングとエンドツーエンド最適化の利点を組み合わせた,学習型階層型双方向ビデオ(LHBDC)を提案する。
論文 参考訳(メタデータ) (2021-12-17T14:30:22Z) - Perceptual Learned Video Compression with Recurrent Conditional GAN [158.0726042755]
本稿では, PVC (Perceptual Learned Video Compression) アプローチを提案する。
PLVCは低ビットレートで映像を知覚品質に圧縮することを学ぶ。
ユーザスタディでは、最新の学習ビデオ圧縮手法と比較して、PLVCの優れた知覚性能をさらに検証している。
論文 参考訳(メタデータ) (2021-09-07T13:36:57Z) - Learned Video Codec with Enriched Reconstruction for CLIC P-frame Coding [11.000499414131324]
本稿では,学習画像圧縮(clic, cvprworkshop)2020 p-frame符号化のための学習ベースのビデオを提案する。
より具体的には、残差符号信号と運動ベクトルのためのRefine-Netを用いた圧縮機ネットワークを設計した。
ビデオでは,CLIC P-frame Challengeで指定されたデコーダ側の完全参照フレームを用いて,その性能を示す。
論文 参考訳(メタデータ) (2020-12-14T12:32:46Z) - Content Adaptive and Error Propagation Aware Deep Video Compression [110.31693187153084]
本稿では,コンテンツ適応型・誤り伝搬対応型ビデオ圧縮システムを提案する。
本手法では, 複数フレームの圧縮性能を1フレームではなく複数フレームで考慮し, 共同学習手法を用いる。
従来の圧縮システムでは手作りのコーディングモードを使用する代わりに,オンラインエンコーダ更新方式をシステム内に設計する。
論文 参考訳(メタデータ) (2020-03-25T09:04:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。