Fugu-MT 論文翻訳(概要): Efficient Dynamic-NeRF Based Volumetric Video Coding with Rate Distortion Optimization

論文の概要: Efficient Dynamic-NeRF Based Volumetric Video Coding with Rate Distortion Optimization

arxiv url: http://arxiv.org/abs/2402.01380v1
Date: Fri, 2 Feb 2024 13:03:20 GMT
ステータス: 翻訳完了
システム内更新日: 2024-02-05 15:29:07.350197
Title: Efficient Dynamic-NeRF Based Volumetric Video Coding with Rate Distortion Optimization
Title（参考訳）: レート歪み最適化による高能率動的nerfベースボリュームビデオ符号化
Authors: Zhiyu Zhang, Guo Lu, Huanxiong Liang, Anni Tang, Qiang Hu, Li Song
Abstract要約: NeRFは、シンプルな表現と強力な3Dモデリング機能のおかげで、ボリュームビデオ圧縮において顕著な可能性を秘めている。 ReRFは、モデリングを圧縮プロセスから分離し、最適化された圧縮効率をもたらす。本稿では,よりコンパクトな動的NeRFに基づくボリュームビデオ圧縮手法を提案する。
参考スコア（独自算出の注目度）: 21.089468798269674
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Volumetric videos, benefiting from immersive 3D realism and interactivity, hold vast potential for various applications, while the tremendous data volume poses significant challenges for compression. Recently, NeRF has demonstrated remarkable potential in volumetric video compression thanks to its simple representation and powerful 3D modeling capabilities, where a notable work is ReRF. However, ReRF separates the modeling from compression process, resulting in suboptimal compression efficiency. In contrast, in this paper, we propose a volumetric video compression method based on dynamic NeRF in a more compact manner. Specifically, we decompose the NeRF representation into the coefficient fields and the basis fields, incrementally updating the basis fields in the temporal domain to achieve dynamic modeling. Additionally, we perform end-to-end joint optimization on the modeling and compression process to further improve the compression efficiency. Extensive experiments demonstrate that our method achieves higher compression efficiency compared to ReRF on various datasets.
Abstract（参考訳）: 没入的な3d現実主義と対話性から恩恵を受けたボリュームビデオは、様々なアプリケーションにとって大きな可能性を秘めている。最近、NeRFは、そのシンプルな表現と強力な3Dモデリング能力により、ボリュームビデオ圧縮において顕著な可能性を実証している。しかし、rerfはモデルを圧縮プロセスから分離し、サブ最適圧縮効率をもたらす。一方,本稿では,よりコンパクトな動的NeRFに基づくボリュームビデオ圧縮手法を提案する。具体的には、nrf表現を係数場と基底場に分解し、時間領域の基底フィールドを段階的に更新して動的モデリングを行う。さらに,圧縮効率をさらに向上させるために,モデリングと圧縮プロセスのエンドツーエンド共同最適化を行う。実験により, 各種データセットのReRFと比較して圧縮効率が高いことを示した。

関連論文リスト

Ultra Lowrate Image Compression with Semantic Residual Coding and Compression-aware Diffusion [28.61304513668606]
ResULICは残留誘導型超低レート画像圧縮システムである。残差信号は意味検索と拡散に基づく生成プロセスの両方に組み込む。最先端拡散法に比べて客観的・主観的性能に優れる。
論文参考訳（メタデータ） (2025-05-13T06:51:23Z)
Multi-Scale Invertible Neural Network for Wide-Range Variable-Rate Learned Image Compression [90.59962443790593]
本稿では,制限を克服するために,可逆変換に基づく可変レート画像圧縮モデルを提案する。具体的には、入力画像をマルチスケールの潜在表現にマッピングする、軽量なマルチスケール非可逆ニューラルネットワークを設計する。実験結果から,提案手法は既存の可変レート法と比較して最先端性能を実現することが示された。
論文参考訳（メタデータ） (2025-03-27T09:08:39Z)
4DGC: Rate-Aware 4D Gaussian Compression for Efficient Streamable Free-Viewpoint Video [56.04182926886754]
3D Gaussian Splatting (3DGS)は、フォトリアリスティック・フリー・ビューポイント・ビデオ(FVV)体験を可能にする大きな可能性を秘めている。既存の方法は、動的3DGS表現と圧縮を別々に扱うのが一般的である。本稿では,FVVのRD性能を向上しつつ,ストレージサイズを大幅に削減するレート対応4Dガウス圧縮フレームワークである4DGCを提案する。
論文参考訳（メタデータ） (2025-03-24T08:05:27Z)
MambaIC: State Space Models for High-Performance Learned Image Compression [53.991726013454695]
多数のフィールドをまたいだリアルタイム情報伝送には,高性能な画像圧縮アルゴリズムが不可欠である。状態空間モデル(SSM)の長距離依存性の捕捉効果に着想を得て,SSMを利用して既存手法の計算不効率に対処する。そこで本稿では,MambaICと呼ばれる洗練されたコンテキストモデリングによる画像圧縮手法を提案する。
論文参考訳（メタデータ） (2025-03-16T11:32:34Z)
Spatial Degradation-Aware and Temporal Consistent Diffusion Model for Compressed Video Super-Resolution [13.103621878352314]
ビデオスーパーレゾリューション (VSR) はビデオの高精細化に有効な手法であるが、比較的VSR法は圧縮ビデオに焦点を当てている。圧縮VSRのための空間劣化認識・時間一貫性拡散モデルを提案する。
論文参考訳（メタデータ） (2025-02-11T08:57:45Z)
VRVVC: Variable-Rate NeRF-Based Volumetric Video Compression [59.14355576912495]
NeRFベースのビデオは、FVV(Photorealistic Free-Viewpoint Video)体験を提供することによって、ビジュアルメディアに革命をもたらした。大量のデータボリュームは、ストレージと送信に重大な課題をもたらす。ビデオ圧縮のための新しいエンドツーエンドの可変レートフレームワークであるVRVVCを提案する。
論文参考訳（メタデータ） (2024-12-16T01:28:04Z)
Rate-aware Compression for NeRF-based Volumetric Video [21.372568857027748]
放射場(NeRF)は3次元ボリュームビデオ技術の開発を進展させてきた。既存のソリューションは、トレーニング段階の後にNeRF表現を圧縮し、表現訓練と圧縮を分離する。本稿では,提案するレートアウェア圧縮フレームワークに基づいて,トレーニング段階におけるボリュームビデオのコンパクトなNeRF表現を直接学習する。
論文参考訳（メタデータ） (2024-11-08T04:29:14Z)
Neural NeRF Compression [19.853882143024]
最近のNeRFは、レンダリング品質とスピードを改善するために機能グリッドを利用している。これらの表現は、大きなストレージオーバーヘッドをもたらす。本稿では,グリッドベースNeRFモデルを効率よく圧縮する新しい手法を提案する。
論文参考訳（メタデータ） (2024-06-13T09:12:26Z)
JointRF: End-to-End Joint Optimization for Dynamic Neural Radiance Field Representation and Compression [39.403294185116]
本稿では,動的NeRF表現と圧縮を両立する新しいエンドツーエンドのジョイント最適化手法,JointRFを提案する。ジョイントRFは, 従来手法に比べて, 品質と圧縮効率を著しく向上させる。
論文参考訳（メタデータ） (2024-05-23T11:32:46Z)
Compression-Realized Deep Structural Network for Video Quality Enhancement [78.13020206633524]
本稿では,圧縮ビデオの品質向上の課題に焦点をあてる。既存の手法のほとんどは、圧縮コーデック内での事前処理を最適に活用するための構造設計を欠いている。新しいパラダイムは、より意識的な品質向上プロセスのために緊急に必要である。
論文参考訳（メタデータ） (2024-05-10T09:18:17Z)
SPC-NeRF: Spatial Predictive Compression for Voxel Based Radiance Field [41.33347056627581]
本稿では,EVG圧縮に空間予測符号化を適用した新しいフレームワークであるSPC-NeRFを提案する。我々の手法は最先端のVQRFに比べて32%のビット節約が可能である。
論文参考訳（メタデータ） (2024-02-26T07:40:45Z)
Learned Video Compression via Heterogeneous Deformable Compensation Network [78.72508633457392]
不安定な圧縮性能の問題に対処するために,不均一変形補償戦略(HDCVC)を用いた学習ビデオ圧縮フレームワークを提案する。より具体的には、提案アルゴリズムは隣接する2つのフレームから特徴を抽出し、コンテンツ近傍の不均一な変形(HetDeform)カーネルオフセットを推定する。実験結果から,HDCVCは最近の最先端の学習ビデオ圧縮手法よりも優れた性能を示した。
論文参考訳（メタデータ） (2022-07-11T02:31:31Z)
Learning True Rate-Distortion-Optimization for End-To-End Image Compression [59.816251613869376]
速度歪みの最適化は、従来の画像圧縮とビデオ圧縮の重要な部分である。本稿では,RDO結果の低複雑さ推定をトレーニングに導入することにより,トレーニングの強化を図る。我々は以前のRDONetモデルに比べてMS-SSIMで平均19.6%のレートセーブを実現し、従来のディープイメージコーダに比べて27.3%のレートセーブを実現した。
論文参考訳（メタデータ） (2022-01-05T13:02:00Z)
Towards Compact CNNs via Collaborative Compression [166.86915086497433]
チャネルプルーニングとテンソル分解を結合してCNNモデルを圧縮する協調圧縮方式を提案する。 52.9%のFLOPを削減し、ResNet-50で48.4%のパラメータを削除しました。
論文参考訳（メタデータ） (2021-05-24T12:07:38Z)
COMISR: Compression-Informed Video Super-Resolution [76.94152284740858]
ウェブやモバイルデバイスのほとんどのビデオは圧縮され、帯域幅が制限されると圧縮は厳しい。圧縮によるアーティファクトを導入せずに高解像度コンテンツを復元する圧縮インフォームドビデオ超解像モデルを提案する。
論文参考訳（メタデータ） (2021-05-04T01:24:44Z)
Slimmable Compressive Autoencoders for Practical Neural Image Compression [20.715312224456138]
実画像圧縮のためのスリム圧縮オートエンコーダ(SlimCAEs)を提案する。 SlimCAEは、優れたレート歪み性能、可変率、メモリの動的調整、計算コスト、レイテンシを提供する柔軟性の高いモデルです。
論文参考訳（メタデータ） (2021-03-29T16:12:04Z)
End-to-End Facial Deep Learning Feature Compression with Teacher-Student Enhancement [57.18801093608717]
本稿では,ディープニューラルネットワークの表現と学習能力を活用することで,エンドツーエンドの特徴圧縮手法を提案する。特に、抽出した特徴量を、レート歪みコストを最適化することにより、エンドツーエンドでコンパクトに符号化する。提案モデルの有効性を顔の特徴で検証し, 圧縮性能を高いレート精度で評価した。
論文参考訳（メタデータ） (2020-02-10T10:08:44Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。