論文の概要: Learned Rate Control for Frame-Level Adaptive Neural Video Compression via Dynamic Neural Network
- arxiv url: http://arxiv.org/abs/2508.20709v1
- Date: Thu, 28 Aug 2025 12:27:23 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-29 18:12:02.379275
- Title: Learned Rate Control for Frame-Level Adaptive Neural Video Compression via Dynamic Neural Network
- Title(参考訳): 動的ニューラルネットワークによるフレームレベル適応型ニューラルビデオ圧縮の学習速度制御
- Authors: Chenhao Zhang, Wei Gao,
- Abstract要約: 可変シナリオ用に設計された動的ビデオ圧縮フレームワークを提案する。
提案手法は,最先端法よりも平均BD-Rateの14.8%,BD-PSNRの0.47dBのゲインを達成できる。
- 参考スコア(独自算出の注目度): 8.645355715511702
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Neural Video Compression (NVC) has achieved remarkable performance in recent years. However, precise rate control remains a challenge due to the inherent limitations of learning-based codecs. To solve this issue, we propose a dynamic video compression framework designed for variable bitrate scenarios. First, to achieve variable bitrate implementation, we propose the Dynamic-Route Autoencoder with variable coding routes, each occupying partial computational complexity of the whole network and navigating to a distinct RD trade-off. Second, to approach the target bitrate, the Rate Control Agent estimates the bitrate of each route and adjusts the coding route of DRA at run time. To encompass a broad spectrum of variable bitrates while preserving overall RD performance, we employ the Joint-Routes Optimization strategy, achieving collaborative training of various routes. Extensive experiments on the HEVC and UVG datasets show that the proposed method achieves an average BD-Rate reduction of 14.8% and BD-PSNR gain of 0.47dB over state-of-the-art methods while maintaining an average bitrate error of 1.66%, achieving Rate-Distortion-Complexity Optimization (RDCO) for various bitrate and bitrate-constrained applications. Our code is available at https://git.openi.org.cn/OpenAICoding/DynamicDVC.
- Abstract(参考訳): ニューラルビデオ圧縮(NVC)は近年,目覚ましい性能を発揮している。
しかし、学習ベースのコーデックに固有の制限があるため、正確な速度制御は依然として課題である。
この問題を解決するために,可変ビットレートシナリオ用に設計された動的ビデオ圧縮フレームワークを提案する。
まず、可変ビットレート実装を実現するために、可変符号化経路を持つ動的ルートオートエンコーダを提案し、それぞれがネットワーク全体の部分的な計算複雑性を占有し、異なるRDトレードオフにナビゲートする。
第2に、目標ビットレートに近づくために、レート制御エージェントは、各経路のビットレートを推定し、実行時のDRAの符号化経路を調整する。
RD性能を保ちながら可変ビットレートの広い範囲を網羅するため,様々な経路の協調学習を実現するために,ジョイント・ルート最適化方式を採用する。
HEVCおよびUVGデータセットの大規模な実験により,提案手法は平均BD-Rateの14.8%,BD-PSNRの0.47dBのゲインを実現し,平均Brate誤差は1.66%を維持し,各種ビットレートおよびビットレート制約のあるアプリケーションに対してRDCO(rate-Distortion-Complexity Optimization)を達成した。
私たちのコードはhttps://git.openi.org.cn/OpenAICoding/DynamicDVCで利用可能です。
関連論文リスト
- Multi-Scale Invertible Neural Network for Wide-Range Variable-Rate Learned Image Compression [90.59962443790593]
本稿では,制限を克服するために,可逆変換に基づく可変レート画像圧縮モデルを提案する。
具体的には、入力画像をマルチスケールの潜在表現にマッピングする、軽量なマルチスケール非可逆ニューラルネットワークを設計する。
実験結果から,提案手法は既存の可変レート法と比較して最先端性能を実現することが示された。
論文 参考訳(メタデータ) (2025-03-27T09:08:39Z) - CANeRV: Content Adaptive Neural Representation for Video Compression [89.35616046528624]
映像圧縮のためのコンテンツ適応型ニューラル表現法(CANeRV)を提案する。
CANeRVは革新的なINRベースのビデオ圧縮ネットワークであり、各ビデオシーケンスの特定の内容に基づいて、構造最適化を適応的に行う。
CNeRVはH.266/VVCと最先端のINRベースの動画圧縮技術の両方を多種多様なビデオデータセットで上回り得ることを示す。
論文 参考訳(メタデータ) (2025-02-10T06:21:16Z) - HPC: Hierarchical Progressive Coding Framework for Volumetric Video [39.403294185116]
ニューラルレージアンスフィールド(NeRF)に基づくボリュームビデオは、様々な3Dアプリケーションに対して大きな可能性を秘めている。
現在のNeRF圧縮は、ビデオ品質を調整できる柔軟性に欠けており、様々なネットワークやデバイス能力のための単一のモデル内である。
単一モデルを用いて可変性を実現する新しい階層型プログレッシブビデオ符号化フレームワークであるHPCを提案する。
論文 参考訳(メタデータ) (2024-07-12T06:34:24Z) - Progressive Learning with Visual Prompt Tuning for Variable-Rate Image
Compression [60.689646881479064]
本稿では,変圧器を用いた可変レート画像圧縮のためのプログレッシブラーニングパラダイムを提案する。
視覚的プロンプトチューニングにインスパイアされた私たちは,エンコーダ側とデコーダ側でそれぞれ入力画像と隠蔽特徴のプロンプトを抽出するためにLPMを使用する。
提案モデルでは, 速度歪み特性の観点から現行の可変画像法よりも優れ, スクラッチから訓練した最先端の固定画像圧縮法にアプローチする。
論文 参考訳(メタデータ) (2023-11-23T08:29:32Z) - Flexible Neural Image Compression via Code Editing [8.499248314440557]
ニューラル画像圧縮(NIC)は、レート歪み(R-D)性能において従来の画像コーデックよりも優れていた。
通常、R-D曲線の各点に専用エンコーダとデコーダのペアが必要であるため、実際の展開を妨げている。
本稿では,セミアモタイズされた推論と適応量子化に基づくNICの高フレキシブルな符号化手法であるCode Editingを提案する。
論文 参考訳(メタデータ) (2022-09-19T09:41:43Z) - Learned Multi-Resolution Variable-Rate Image Compression with
Octave-based Residual Blocks [15.308823742699039]
一般化オクターブ畳み込み(GoConv)と一般化オクターブ畳み込み(GoTConv)を用いた新しい可変レート画像圧縮フレームワークを提案する。
単一モデルが異なるビットレートで動作し、複数レートの画像特徴を学習できるようにするため、新しい目的関数が導入される。
実験結果から,H.265/HEVCベースのBPGや最先端の学習に基づく可変レート法などの標準コーデックよりも高い性能を示した。
論文 参考訳(メタデータ) (2020-12-31T06:26:56Z) - Neural Rate Control for Video Encoding using Imitation Learning [15.603639771786927]
ニューラルレート制御ポリシーの学習に模倣学習を適用します。
学習したポリシーはビデオ品質を犠牲にすることなく8.5%の中央値削減を達成している。
論文 参考訳(メタデータ) (2020-12-09T21:59:20Z) - Efficient Adaptation of Neural Network Filter for Video Compression [10.769305738505071]
本稿では,ニューラルネットワークフィルタのための効率的なファインタニング手法を提案する。
微細チューニングは、エンコーダ側で行われ、ニューラルネットワークが符号化されている特定のコンテンツに適応する。
提案手法は従来のファインタニング手法よりもはるかに高速である。
論文 参考訳(メタデータ) (2020-07-28T14:24:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。