論文の概要: Neural Video Compression with Domain Transfer
- arxiv url: http://arxiv.org/abs/2605.13476v1
- Date: Wed, 13 May 2026 13:02:40 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-14 23:30:28.058389
- Title: Neural Video Compression with Domain Transfer
- Title(参考訳): ドメイン転送によるニューラルビデオ圧縮
- Authors: Tiange Zhang, Rongqun Lin, Xiandong Meng, Haofeng Wang, Xing Tian, Qi Zhang, Siwei Ma,
- Abstract要約: DCVC-DTはドメイン転送強化ニューラルビデオ圧縮フレームワークである。
本研究では,品質変動に基づく損失におけるRとDの比を積極的に制御するフレームレベルの動的RD(Rate and Distortion)調整手法を開発した。
- 参考スコア(独自算出の注目度): 67.17233008935996
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Content-adaptive compression has always been a key direction in neural video coding (NVC), aiming to mitigate the domain gap between training and testing data. Such gaps often arise from distributional discrepancies between training and inference data, which may cause noticeable performance degradation when the testing content differs from the training distribution. To tackle this challenge, we propose DCVC-DT, a domain transfer enhanced neural video compression framework. Specifically, we design a lightweight online domain transfer (DT) mechanism that dynamically adapts the encoded latent representation during inference, effectively bridging the domain gap without modifying the encoder or decoder parameters. In addition, we develop a frame-level dynamic RD (Rate and Distortion) adjustment scheme that actively regulates the ratio of R and D in the loss function based on quality fluctuation, thereby improving rate-distortion performance. Extensive experiments demonstrate that DCVC-DT achieves up to 6.21% bitrate savings over the baseline DCVC-DC, while significantly enhancing generalization to unseen testing data and alleviating error propagation. Our code is available at https://github.com/SunnyMass/DCVC-DT.
- Abstract(参考訳): コンテンツ適応圧縮は、トレーニングとテストデータのドメインギャップを軽減することを目的として、ニューラルビデオ符号化(NVC)において、常に重要な方向である。
このようなギャップは、トレーニングデータと推論データの分布の相違から生じることが多く、テスト内容がトレーニング分布と異なる場合、顕著なパフォーマンス劣化を引き起こす可能性がある。
この課題に対処するために、ドメイン転送強化ニューラルビデオ圧縮フレームワークであるDCVC-DTを提案する。
具体的には、推論中に符号化された潜在表現を動的に適応させる軽量なオンラインドメイン転送(DT)機構を設計し、エンコーダパラメータやデコーダパラメータを変更することなくドメインギャップを効果的にブリッジする。
さらに,フレームレベルの動的RD(Rate and Distortion)調整手法を開発し,品質変動に基づく損失関数におけるRとDの比を積極的に制御し,レート歪み性能を向上させる。
大規模な実験により、DCVC-DTはベースラインのDCVC-DC上で最大6.21%のビットレートの節約を実現し、未確認のテストデータへの大幅な一般化とエラーの伝播を緩和した。
私たちのコードはhttps://github.com/SunnyMass/DCVC-DTで利用可能です。
関連論文リスト
- Enhancing Neural Video Compression of Static Scenes with Positive-Incentive Noise [51.028614105626154]
監視フィードやビデオテレフォニーストリームのような静的なシーンビデオは、ストレージ消費とネットワークトラフィックの圧倒的なシェアを占める。
従来の標準コーデックとニューラルビデオ圧縮(NVC)手法は、時間的冗長性の不十分な使用と、トレーニングデータとテストデータの間の重大な分散ギャップのために、これらのビデオを効率的にエンコードするのに苦労している。
静的シーンビデオのNVCに正のインセンティブノイズを組み込むことを提案し, 短時間の時間変化を正のインセンティブノイズとして再解釈し, モデル微調整を容易にする。
論文 参考訳(メタデータ) (2026-03-06T09:47:25Z) - SCALED : Surrogate-gradient for Codec-Aware Learning of Downsampling in ABR Streaming [9.436544348188598]
現在、Over-the-Top (OTT)配信は、主にAdaptive Bitrate (ABR)ストリーミングに依存している。
ディープラーニングは、学習された再サンプリング手法を使用してABRパイプラインを共同最適化することへの関心を喚起している。
そこで本研究では,現実の非微分可能コーデックによるエンドツーエンドのトレーニングを可能にする新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2026-01-30T10:38:35Z) - Content Adaptive based Motion Alignment Framework for Learned Video Compression [72.13599533975413]
本稿では,コンテンツ適応型モーションアライメントフレームワークを提案する。
まず、粗いオフセット予測とマスク変調により動き補償を洗練させる2段階の流動誘導変形防止機構を導入する。
第2に,基準品質に基づいて歪み重みを調整するマルチ参照品質認識戦略を提案する。
第3に,スムーズな動き推定を得るために,フレームを大きさと解像度でダウンサンプルするトレーニングフリーモジュールを統合する。
論文 参考訳(メタデータ) (2025-12-15T02:51:47Z) - Bidirectional Feature-aligned Motion Transformation for Efficient Dynamic Point Cloud Compression [97.66080040613726]
特徴空間における動きを暗黙的にモデル化する双方向特徴整合運動変換(Bi-FMT)フレームワークを提案する。
Bi-FMTは、時間的に一貫した潜在表現を生成するために、過去と将来の両方のフレームで機能を調整する。
圧縮効率とランタイムの両方において, Bi-FMT が D-DPCC と AdaDPCC を上回っていることを示す。
論文 参考訳(メタデータ) (2025-09-18T03:51:06Z) - Learned Rate Control for Frame-Level Adaptive Neural Video Compression via Dynamic Neural Network [8.645355715511702]
可変シナリオ用に設計された動的ビデオ圧縮フレームワークを提案する。
提案手法は,最先端法よりも平均BD-Rateの14.8%,BD-PSNRの0.47dBのゲインを達成できる。
論文 参考訳(メタデータ) (2025-08-28T12:27:23Z) - Rethinking Video Tokenization: A Conditioned Diffusion-based Approach [58.164354605550194]
新しいトークン化ツールであるDiffusion Conditioned-based Gene Tokenizerは、GANベースのデコーダを条件付き拡散モデルで置き換える。
再建に基本的MSE拡散損失とKL項,LPIPSを併用した訓練を行った。
CDTのスケールダウン版(3$times inference speedup)でさえ、トップベースラインと互換性がある。
論文 参考訳(メタデータ) (2025-03-05T17:59:19Z) - VRVVC: Variable-Rate NeRF-Based Volumetric Video Compression [59.14355576912495]
NeRFベースのビデオは、FVV(Photorealistic Free-Viewpoint Video)体験を提供することによって、ビジュアルメディアに革命をもたらした。
大量のデータボリュームは、ストレージと送信に重大な課題をもたらす。
ビデオ圧縮のための新しいエンドツーエンドの可変レートフレームワークであるVRVVCを提案する。
論文 参考訳(メタデータ) (2024-12-16T01:28:04Z) - Dynamic Low-Rank Instance Adaptation for Universal Neural Image
Compression [33.92792778925365]
ドメイン外のデータセットで観測される速度歪みの減少に対処する低ランク適応手法を提案する。
提案手法は,多様な画像データセットにまたがる普遍性を示す。
論文 参考訳(メタデータ) (2023-08-15T12:17:46Z) - OL-DN: Online learning based dual-domain network for HEVC intra frame
quality enhancement [24.91807723834651]
畳み込みニューラルネットワーク(CNN)に基づく手法は,圧縮画像とビデオの品質向上に有効なソリューションを提供する。
本稿では,HEVC内符号化画像の品質向上に生データを応用し,オンライン学習手法を提案する。
提案するオンライン学習ベースデュアルドメインネットワーク(OL-DN)は,最先端手法と比較して優れた性能を示した。
論文 参考訳(メタデータ) (2022-08-09T11:06:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。