論文の概要: CATRF: Codec-Adaptive TriPlane Radiance Fields for Volumetric Content Delivery
- arxiv url: http://arxiv.org/abs/2605.18054v1
- Date: Mon, 18 May 2026 08:42:57 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-19 17:57:49.193245
- Title: CATRF: Codec-Adaptive TriPlane Radiance Fields for Volumetric Content Delivery
- Title(参考訳): CATRF: Codec-Adaptive TriPlane Radiance Fields for Volumetric Content Delivery
- Authors: Tung-I Chen, Lingdong Wang, Subhransu Maji, Ramesh K. Sitaraman,
- Abstract要約: 暗黙のボリューム表現はモデルのサイズを減少させるが、2Dビデオに到達するためには注意深くコーディングする必要がある。
平面フレンドリーキャンバスのための標準コーデシン・ザ・ループフレームワークであるCATRFを提案する。
その結果,低ビットレートで圧縮耐性の容積表現への実践的な道のりが浮かび上がった。
- 参考スコア(独自算出の注目度): 17.043293098328743
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Volumetric media promises next-generation content delivery applications, but its bandwidth demand remains a key bottleneck. Implicit and hybrid volumetric representations reduce model sizes, yet still require careful coding to reach 2D video-like bitrates. We present CATRF, a standard-codec-in-the-loop compression framework for plane-factorized radiance fields. During training, we quantize and pack 2D feature planes into codec-friendly canvases, run a standard codec roundtrip (JPEG/VP9/HEVC/AV1), then unpack and dequantize the decoded features before volume rendering. We use a straight-through estimator (STE) to insert the non-differentiable, standard codec pipeline into the training loop, allowing radiance-field features to adapt directly to the real, client-side codec distortions without introducing any learned codec parameters. On both static and dynamic benchmarks, CATRF consistently achieves a better rate-distortion trade-off over codec-agnostic and learned-codec-in-the-loop baselines, and also outperforms recent compressed 3DGS methods in both compression efficiency and decoding speed. These results highlight a practical path toward low-bitrate, compression-resilient volumetric representations for free-viewpoint video streaming.
- Abstract(参考訳): Volumetric Mediaは、次世代のコンテンツ配信アプリケーションを約束しているが、帯域幅の需要は依然として重要なボトルネックだ。
暗黙的かつハイブリッドなボリューム表現はモデルのサイズを減少させるが、2Dビデオのようなビットレートに到達するには注意深いコーディングが必要である。
CATRFは平面分解放射場のための標準コーデック・イン・ザ・ループ圧縮フレームワークである。
トレーニング中、2D機能プレーンをコーデックフレンドリーなキャンバスに量子化し、標準のコーデックラウンドトリップ(JPEG/VP9/HEVC/AV1)を実行し、ボリュームレンダリングの前にデコードされた機能をアンパックしてデクエント化する。
我々は、ストレートスルー推定器(STE)を用いて、非微分可能な標準コーデックパイプラインをトレーニングループに挿入し、学習したコーデックパラメータを導入することなく、実クライアント側のコーデック歪みに直接適応できるようにする。
静的ベンチマークと動的ベンチマークの両方において、CATRFはコーデック非依存と学習コーデック-イン-ループベースラインよりも高いレート歪みトレードオフを一貫して達成し、圧縮効率と復号速度の両方で最近の圧縮された3DGS法より優れている。
これらの結果は、自由視点ビデオストリーミングのための低ビットレートで圧縮耐性の容積表現への実践的な道のりを浮き彫りにした。
関連論文リスト
- Adaptive 1D Video Diffusion Autoencoder [44.70149252636057]
適応型1次元符号化と拡散型デコードのためのトランスフォーマベースのフレームワークである1次元拡散ビデオ自動符号化(One-DVA)を提案する。
1-DVAは3D-CNN VAEと同等の性能を同じ圧縮比で再現する。
さらに、生成過程によって生じる人工物を軽減するために、生成モデルのためのOne-DVA潜伏分布を規則化し、デコーダを微調整する。
論文 参考訳(メタデータ) (2026-02-04T05:11:12Z) - SCALED : Surrogate-gradient for Codec-Aware Learning of Downsampling in ABR Streaming [9.436544348188598]
現在、Over-the-Top (OTT)配信は、主にAdaptive Bitrate (ABR)ストリーミングに依存している。
ディープラーニングは、学習された再サンプリング手法を使用してABRパイプラインを共同最適化することへの関心を喚起している。
そこで本研究では,現実の非微分可能コーデックによるエンドツーエンドのトレーニングを可能にする新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2026-01-30T10:38:35Z) - Generative Latent Coding for Ultra-Low Bitrate Image and Video Compression [61.500904231491596]
画像圧縮とビデオ圧縮のほとんどの手法は、画素空間における変換符号化を行い、冗長性を低減する。
画像とビデオの圧縮, GLCイメージ, GLC-Video のための textbfGenerative textbfLatent textbfGLC (textbfGLC) モデルを提案する。
論文 参考訳(メタデータ) (2025-05-22T03:31:33Z) - Plug-and-Play Versatile Compressed Video Enhancement [57.62582951699999]
ビデオ圧縮はファイルのサイズを効果的に削減し、リアルタイムのクラウドコンピューティングを可能にする。
しかし、それは視覚的品質の犠牲となり、下流の視覚モデルの堅牢性に挑戦する。
本稿では,異なる圧縮条件下で動画を適応的に拡張する多言語対応拡張フレームワークを提案する。
論文 参考訳(メタデータ) (2025-04-21T18:39:31Z) - Embedding Compression Distortion in Video Coding for Machines [67.97469042910855]
現在、ビデオ伝送は人間の視覚システム(HVS)だけでなく、分析のための機械認識にも役立っている。
本稿では,機械知覚関連歪み表現を抽出し,下流モデルに埋め込む圧縮歪埋め込み(CDRE)フレームワークを提案する。
我々のフレームワークは,実行時間,パラメータ数といったオーバーヘッドを最小限に抑えて,既存のコーデックのレートタスク性能を効果的に向上させることができる。
論文 参考訳(メタデータ) (2025-03-27T13:01:53Z) - Compression-Realized Deep Structural Network for Video Quality Enhancement [78.13020206633524]
本稿では,圧縮ビデオの品質向上の課題に焦点をあてる。
既存の手法のほとんどは、圧縮コーデック内での事前処理を最適に活用するための構造設計を欠いている。
新しいパラダイムは、より意識的な品質向上プロセスのために緊急に必要である。
論文 参考訳(メタデータ) (2024-05-10T09:18:17Z) - Deep Video Codec Control for Vision Models [33.95098277668838]
標準符号化ビデオはディープビジョンモデルの性能を著しく低下させることを示した。
本稿では、帯域制限と下流の深い視力性能の両方を考慮した、エンド・ツー・エンドの学習可能なDeep Video制御について述べる。
論文 参考訳(メタデータ) (2023-08-30T16:44:38Z) - Sandwiched Video Compression: Efficiently Extending the Reach of
Standard Codecs with Neural Wrappers [11.968545394054816]
本稿では,標準的なビデオにニューラルネットワークをラップするビデオ圧縮システムを提案する。
ネットワークは、速度歪み損失関数を最適化するために共同で訓練される。
HEVCと同等品質で30%の改善が見られた。
論文 参考訳(メタデータ) (2023-03-20T22:03:44Z) - High Fidelity Neural Audio Compression [92.4812002532009]
我々は、ニューラルネットワークを利用した最先端のリアルタイム、高忠実、オーディオを導入する。
ストリーミングエンコーダ-デコーダアーキテクチャと、エンドツーエンドでトレーニングされた量子化潜在空間で構成されている。
単一マルチスケール・スペクトログラム・アドバイザリーを用いて、トレーニングを簡素化し、高速化する。
論文 参考訳(メタデータ) (2022-10-24T17:52:02Z) - Content Adaptive and Error Propagation Aware Deep Video Compression [110.31693187153084]
本稿では,コンテンツ適応型・誤り伝搬対応型ビデオ圧縮システムを提案する。
本手法では, 複数フレームの圧縮性能を1フレームではなく複数フレームで考慮し, 共同学習手法を用いる。
従来の圧縮システムでは手作りのコーディングモードを使用する代わりに,オンラインエンコーダ更新方式をシステム内に設計する。
論文 参考訳(メタデータ) (2020-03-25T09:04:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。