Fugu-MT 論文翻訳(概要): Accelerating Learned Video Compression via Low-Resolution Representation Learning

論文の概要: Accelerating Learned Video Compression via Low-Resolution Representation Learning

arxiv url: http://arxiv.org/abs/2407.16418v1
Date: Tue, 23 Jul 2024 12:02:57 GMT
ステータス: 翻訳完了
システム内更新日: 2024-07-24 17:26:03.778049
Title: Accelerating Learned Video Compression via Low-Resolution Representation Learning
Title（参考訳）: 低解像度表現学習による学習ビデオ圧縮の高速化
Authors: Zidian Qiu, Zongyao He, Zhi Jin,
Abstract要約: 低解像度表現学習に焦点を当てた学習ビデオ圧縮のための効率最適化フレームワークを提案する。提案手法は,H.266参照ソフトウェアVTMの低遅延P構成と同等の性能を実現する。
参考スコア（独自算出の注目度）: 18.399027308582596
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: In recent years, the field of learned video compression has witnessed rapid advancement, exemplified by the latest neural video codecs DCVC-DC that has outperformed the upcoming next-generation codec ECM in terms of compression ratio. Despite this, learned video compression frameworks often exhibit low encoding and decoding speeds primarily due to their increased computational complexity and unnecessary high-resolution spatial operations, which hugely hinder their applications in reality. In this work, we introduce an efficiency-optimized framework for learned video compression that focuses on low-resolution representation learning, aiming to significantly enhance the encoding and decoding speeds. Firstly, we diminish the computational load by reducing the resolution of inter-frame propagated features obtained from reused features of decoded frames, including I-frames. We implement a joint training strategy for both the I-frame and P-frame models, further improving the compression ratio. Secondly, our approach efficiently leverages multi-frame priors for parameter prediction, minimizing computation at the decoding end. Thirdly, we revisit the application of the Online Encoder Update (OEU) strategy for high-resolution sequences, achieving notable improvements in compression ratio without compromising decoding efficiency. Our efficiency-optimized framework has significantly improved the balance between compression ratio and speed for learned video compression. In comparison to traditional codecs, our method achieves performance levels on par with the low-decay P configuration of the H.266 reference software VTM. Furthermore, when contrasted with DCVC-HEM, our approach delivers a comparable compression ratio while boosting encoding and decoding speeds by a factor of 3 and 7, respectively. On RTX 2080Ti, our method can decode each 1080p frame under 100ms.
Abstract（参考訳）: 近年、学習ビデオ圧縮の分野では、圧縮比で次世代コーデックECMを上回った最新のニューラルビデオコーデックDCVC-DCが示すように、急速な進歩が見られた。これにもかかわらず、学習されたビデオ圧縮フレームワークは、主に計算複雑性の増大と不要な高解像度空間操作のために、符号化と復号の速度が低い。本研究では,低分解能表現学習に着目し,符号化速度と復号速度を大幅に向上することを目的とした,学習ビデオ圧縮の効率最適化フレームワークを提案する。まず、Iフレームを含む復号化フレームの再利用特徴から得られたフレーム間伝播特徴の分解能を低減し、計算負荷を低減させる。我々は,IフレームモデルとPフレームモデルの両方に対して共同トレーニング戦略を実装し,圧縮率をさらに向上させる。第二に,提案手法はパラメータ予測にマルチフレームの事前処理を効果的に利用し,デコード終了時の計算を最小化する。第3に、高精細シーケンスに対するオンラインエンコーダ更新(OEU)戦略の適用を再検討し、復号効率を損なうことなく圧縮率の顕著な改善を実現した。我々の効率最適化フレームワークは,学習ビデオ圧縮における圧縮比と速度のバランスを大幅に改善した。従来のコーデックと比較して,H.266参照ソフトウェアVTMの低遅延P構成に匹敵する性能を実現する。さらに,DCVC-HEMと対比した場合,符号化速度と復号速度をそれぞれ3倍と7倍に向上させながら,同等の圧縮比を提供する。 RTX 2080Tiでは、各1080pフレームを100ms以下でデコードできる。

関連論文リスト

Plug-and-Play Versatile Compressed Video Enhancement [57.62582951699999]
ビデオ圧縮はファイルのサイズを効果的に削減し、リアルタイムのクラウドコンピューティングを可能にする。しかし、それは視覚的品質の犠牲となり、下流の視覚モデルの堅牢性に挑戦する。本稿では,異なる圧縮条件下で動画を適応的に拡張する多言語対応拡張フレームワークを提案する。
論文参考訳（メタデータ） (2025-04-21T18:39:31Z)
Embedding Compression Distortion in Video Coding for Machines [67.97469042910855]
現在、ビデオ伝送は人間の視覚システム(HVS)だけでなく、分析のための機械認識にも役立っている。本稿では,機械知覚関連歪み表現を抽出し,下流モデルに埋め込む圧縮歪埋め込み(CDRE)フレームワークを提案する。我々のフレームワークは,実行時間,パラメータ数といったオーバーヘッドを最小限に抑えて,既存のコーデックのレートタスク性能を効果的に向上させることができる。
論文参考訳（メタデータ） (2025-03-27T13:01:53Z)
REGEN: Learning Compact Video Embedding with (Re-)Generative Decoder [52.698595889988766]
生成モデルのためのビデオ埋め込み学習について,新しい視点を提示する。入力ビデオの正確な再生を必要とせず、効果的な埋め込みは視覚的に妥当な再構築に焦点を当てるべきである。本稿では,従来のエンコーダ・デコーダ・ビデオ埋め込みをエンコーダ・ジェネレータ・フレームワークに置き換えることを提案する。
論文参考訳（メタデータ） (2025-03-11T17:51:07Z)
High-Efficiency Neural Video Compression via Hierarchical Predictive Learning [27.41398149573729]
強化されたDeep Hierarchical Video Compression(DHVC 2.0)は、優れた圧縮性能と目覚ましい複雑さの効率を導入する。階層的な予測符号化を使用して、各ビデオフレームをマルチスケール表現に変換する。トランスミッションフレンドリーなプログレッシブデコーディングをサポートしており、パケットロスの存在下では特にネットワーク化されたビデオアプリケーションに有利である。
論文参考訳（メタデータ） (2024-10-03T15:40:58Z)
Low-complexity Deep Video Compression with A Distributed Coding Architecture [4.5885672744218]
一般的な予測符号化に基づくビデオ圧縮手法は、時間的冗長性を低減するために重エンコーダに依存している。従来の分散コーディング手法は、予測的コーディングとはかなりのパフォーマンスギャップに悩まされている。本稿では,レート歪み特性を改善するために,最初のエンドツーエンドの分散ビデオ圧縮フレームワークを提案する。
論文参考訳（メタデータ） (2023-03-21T05:34:04Z)
Deep Lossy Plus Residual Coding for Lossless and Near-lossless Image Compression [85.93207826513192]
本稿では、損失のない画像圧縮とほぼロスレス画像圧縮の両面において、統合された強力な深い損失+残差(DLPR)符号化フレームワークを提案する。 VAEのアプローチにおける連立損失と残留圧縮の問題を解く。ほぼロスレスモードでは、元の残差を量子化し、与えられた$ell_infty$エラー境界を満たす。
論文参考訳（メタデータ） (2022-09-11T12:11:56Z)
Leveraging Bitstream Metadata for Fast, Accurate, Generalized Compressed Video Quality Enhancement [74.1052624663082]
圧縮ビデオの細部を復元する深層学習アーキテクチャを開発した。これにより,従来の圧縮補正法と比較して復元精度が向上することを示す。我々は、ビットストリームで容易に利用できる量子化データに対して、我々のモデルを条件付けする。
論文参考訳（メタデータ） (2022-01-31T18:56:04Z)
Neural JPEG: End-to-End Image Compression Leveraging a Standard JPEG Encoder-Decoder [73.48927855855219]
本稿では,エンコーダとデコーダの両端に内在するニューラル表現を強化することで,符号化性能の向上を図るシステムを提案する。実験により,提案手法はJPEGに対する速度歪み性能を,様々な品質指標で改善することを示した。
論文参考訳（メタデータ） (2022-01-27T20:20:03Z)
Conditional Entropy Coding for Efficient Video Compression [82.35389813794372]
本稿では,フレーム間の条件エントロピーをモデル化することのみに焦点を当てた,非常にシンプルで効率的なビデオ圧縮フレームワークを提案する。まず、画像遅延符号間のエントロピーをモデル化する単純なアーキテクチャが、他のニューラルビデオ圧縮やビデオコーデックと同等の競争力を持つことを示す。次に、このアーキテクチャの上に新しい内部学習拡張を提案し、復号速度を抑えることなく10%の節約を実現した。
論文参考訳（メタデータ） (2020-08-20T20:01:59Z)
Variable Rate Video Compression using a Hybrid Recurrent Convolutional Learning Framework [1.9290392443571382]
本稿では,予測自動符号化の概念に基づくハイブリッドビデオ圧縮フレームワークであるPredEncoderを提案する。可変レートブロック符号化方式が論文で提案され,ビットレート比が著しく向上した。
論文参考訳（メタデータ） (2020-04-08T20:49:25Z)
Content Adaptive and Error Propagation Aware Deep Video Compression [110.31693187153084]
本稿では,コンテンツ適応型・誤り伝搬対応型ビデオ圧縮システムを提案する。本手法では, 複数フレームの圧縮性能を1フレームではなく複数フレームで考慮し, 共同学習手法を用いる。従来の圧縮システムでは手作りのコーディングモードを使用する代わりに,オンラインエンコーダ更新方式をシステム内に設計する。
論文参考訳（メタデータ） (2020-03-25T09:04:24Z)
Learning for Video Compression with Hierarchical Quality and Recurrent Enhancement [164.7489982837475]
本稿では,階層型ビデオ圧縮(HLVC)手法を提案する。我々のHLVCアプローチでは、エンコーダ側とデコーダ側の低品質フレームの圧縮と強化を容易にするため、階層的品質は符号化効率の恩恵を受ける。
論文参考訳（メタデータ） (2020-03-04T09:31:37Z)
A Unified End-to-End Framework for Efficient Deep Image Compression [35.156677716140635]
本稿では,3つの新しい技術に基づくEDIC(Efficient Deep Image Compression)という統合フレームワークを提案する。具体的には、学習に基づく画像圧縮のためのオートエンコーダスタイルのネットワークを設計する。 EDIC法は,映像圧縮性能を向上させるために,Deep Video Compression (DVC) フレームワークに容易に組み込むことができる。
論文参考訳（メタデータ） (2020-02-09T14:21:08Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。