論文の概要: Feature-aligned Motion Transformation for Efficient Dynamic Point Cloud Compression
- arxiv url: http://arxiv.org/abs/2509.14591v1
- Date: Thu, 18 Sep 2025 03:51:06 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-19 17:26:53.053917
- Title: Feature-aligned Motion Transformation for Efficient Dynamic Point Cloud Compression
- Title(参考訳): 効率的なダイナミックポイントクラウド圧縮のための特徴整列運動変換
- Authors: Xuan Deng, Xiandong Meng, Longguang Wang, Tiange Zhang, Xiaopeng Fan, Debin Zhao,
- Abstract要約: 動的ポイントクラウド圧縮のためのFMT(Motion Transformation Feature)フレームワークを提案する。
FMTは明示的な運動ベクトルを連続時間変動を暗黙的にモデル化するアライメント戦略に置き換える。
本手法は, 符号化効率と復号効率の両方でD-DPCCおよびAdaDPCCを上回り, 20%, 9.4%のBD-Rate還元を達成する。
- 参考スコア(独自算出の注目度): 96.50160784402338
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Dynamic point clouds are widely used in applications such as immersive reality, robotics, and autonomous driving. Efficient compression largely depends on accurate motion estimation and compensation, yet the irregular structure and significant local variations of point clouds make this task highly challenging. Current methods often rely on explicit motion estimation, whose encoded vectors struggle to capture intricate dynamics and fail to fully exploit temporal correlations. To overcome these limitations, we introduce a Feature-aligned Motion Transformation (FMT) framework for dynamic point cloud compression. FMT replaces explicit motion vectors with a spatiotemporal alignment strategy that implicitly models continuous temporal variations, using aligned features as temporal context within a latent-space conditional encoding framework. Furthermore, we design a random access (RA) reference strategy that enables bidirectional motion referencing and layered encoding, thereby supporting frame-level parallel compression. Extensive experiments demonstrate that our method surpasses D-DPCC and AdaDPCC in both encoding and decoding efficiency, while also achieving BD-Rate reductions of 20% and 9.4%, respectively. These results highlight the effectiveness of FMT in jointly improving compression efficiency and processing performance.
- Abstract(参考訳): ダイナミックポイントクラウドは、没入型現実、ロボット工学、自律運転などのアプリケーションで広く利用されている。
効率的な圧縮は正確な運動推定と補償に大きく依存するが、不規則な構造と点雲のかなりの局所的な変動は、この仕事を非常に困難にしている。
現在の手法は、しばしば明示的な運動推定に依存しており、符号化されたベクトルは複雑なダイナミクスを捉えるのに苦労し、時間的相関を完全に活用できない。
このような制限を克服するために,動的ポイントクラウド圧縮のための機能整合型モーショントランスフォーメーション(FMT)フレームワークを導入する。
FMTは明示的な運動ベクトルを時空間の時間的変動を暗黙的にモデル化する時空間アライメント戦略に置き換える。
さらに、双方向動作参照と階層化符号化を可能にするランダムアクセス(RA)参照戦略を設計し、フレームレベルの並列圧縮をサポートする。
本手法は, 符号化効率と復号効率の両方でD-DPCCとAdaDPCCを上回り, BD-Rateの20%, 9.4%の削減を実現した。
これらの結果から,FMTの圧縮効率と処理性能を両立させる効果が示された。
関連論文リスト
- ReCoM: Realistic Co-Speech Motion Generation with Recurrent Embedded Transformer [58.49950218437718]
音声に同期した高忠実で一般化可能な人体動作を生成するための効率的なフレームワークであるReCoMを提案する。
Recurrent Embedded Transformer (RET)は、動的埋め込み正規化(DER)をViT(Vit)コアアーキテクチャに統合する。
モデルロバスト性を高めるため,ノイズ抵抗とクロスドメイン一般化の二重性を持つモデルに,提案したDER戦略を取り入れた。
論文 参考訳(メタデータ) (2025-03-27T16:39:40Z) - Multi-Modality Driven LoRA for Adverse Condition Depth Estimation [61.525312117638116]
逆条件深さ推定のためのMulti-Modality Driven LoRA(MMD-LoRA)を提案する。
Prompt Driven Domain Alignment (PDDA) と Visual-Text Consistent Contrastive Learning (VTCCL) の2つのコアコンポーネントで構成されている。
nuScenesとOxford RobotCarデータセットの最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2024-12-28T14:23:58Z) - Layer- and Timestep-Adaptive Differentiable Token Compression Ratios for Efficient Diffusion Transformers [55.87192133758051]
Diffusion Transformer (DiTs)は、最先端(SOTA)画像生成の品質を達成したが、レイテンシとメモリ非効率に悩まされている。
圧縮比の異なる動的DiT推論フレームワークであるDiffCRを提案する。
論文 参考訳(メタデータ) (2024-12-22T02:04:17Z) - U-Motion: Learned Point Cloud Video Compression with U-Structured Temporal Context Generation [10.435212618849544]
ポイントクラウドビデオ(PCV)は、動的シーンと新興アプリケーションを組み合わせた汎用的な3D表現である。
本稿では,PCV形状と属性の両方を学習ベースで圧縮するU-Motionを提案する。
論文 参考訳(メタデータ) (2024-11-21T07:17:01Z) - Dynamic Frame Interpolation in Wavelet Domain [57.25341639095404]
ビデオフレームは、より流動的な視覚体験のためにフレームレートを上げることができる、重要な低レベルな計算ビジョンタスクである。
既存の手法は、高度なモーションモデルと合成ネットワークを利用することで大きな成功を収めた。
WaveletVFIは、同様の精度を維持しながら最大40%の計算を削減できるため、他の最先端技術に対してより効率的に処理できる。
論文 参考訳(メタデータ) (2023-09-07T06:41:15Z) - Learning Dynamic Point Cloud Compression via Hierarchical Inter-frame
Block Matching [35.80653765524654]
3Dダイナミックポイントクラウド(DPC)圧縮は、その時間的コンテキストのマイニングに依存している。
本稿では,階層的ブロックマッチングに基づく予測モジュールを用いた学習型DPC圧縮フレームワークを提案する。
論文 参考訳(メタデータ) (2023-05-09T11:44:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。