論文の概要: SPAC: Sampling-based Progressive Attribute Compression for Dense Point Clouds
- arxiv url: http://arxiv.org/abs/2409.10293v1
- Date: Mon, 16 Sep 2024 13:59:43 GMT
- ステータス: 処理完了
- システム内更新日: 2024-09-17 15:20:32.017935
- Title: SPAC: Sampling-based Progressive Attribute Compression for Dense Point Clouds
- Title(参考訳): SPAC: 密度点雲に対するサンプリングベースプログレッシブ属性圧縮
- Authors: Xiaolong Mao, Hui Yuan, Tian Guo, Shiqi Jiang, Raouf Hamzaoui, Sam Kwong,
- Abstract要約: 本研究では,高密度点雲のエンドツーエンド圧縮法を提案する。
提案手法は,周波数サンプリングモジュール,適応スケール特徴抽出モジュール,幾何支援モジュール,大域的ハイパープライアエントロピーモデルを組み合わせた。
- 参考スコア(独自算出の注目度): 51.313922535437726
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We propose an end-to-end attribute compression method for dense point clouds. The proposed method combines a frequency sampling module, an adaptive scale feature extraction module with geometry assistance, and a global hyperprior entropy model. The frequency sampling module uses a Hamming window and the Fast Fourier Transform to extract high-frequency components of the point cloud. The difference between the original point cloud and the sampled point cloud is divided into multiple sub-point clouds. These sub-point clouds are then partitioned using an octree, providing a structured input for feature extraction. The feature extraction module integrates adaptive convolutional layers and uses offset-attention to capture both local and global features. Then, a geometry-assisted attribute feature refinement module is used to refine the extracted attribute features. Finally, a global hyperprior model is introduced for entropy encoding. This model propagates hyperprior parameters from the deepest (base) layer to the other layers, further enhancing the encoding efficiency. At the decoder, a mirrored network is used to progressively restore features and reconstruct the color attribute through transposed convolutional layers. The proposed method encodes base layer information at a low bitrate and progressively adds enhancement layer information to improve reconstruction accuracy. Compared to the latest G-PCC test model (TMC13v23) under the MPEG common test conditions (CTCs), the proposed method achieved an average Bjontegaard delta bitrate reduction of 24.58% for the Y component (21.23% for YUV combined) on the MPEG Category Solid dataset and 22.48% for the Y component (17.19% for YUV combined) on the MPEG Category Dense dataset. This is the first instance of a learning-based codec outperforming the G-PCC standard on these datasets under the MPEG CTCs.
- Abstract(参考訳): 本研究では,高密度点雲に対するエンドツーエンドの属性圧縮手法を提案する。
提案手法は,周波数サンプリングモジュール,適応スケール特徴抽出モジュール,幾何支援モジュール,大域的ハイパープライアエントロピーモデルを組み合わせた。
周波数サンプリングモジュールは、ハミングウィンドウと高速フーリエ変換を使用して、ポイントクラウドの高周波成分を抽出する。
原点雲とサンプル点雲の差は、複数の部分点雲に分けられる。
これらのサブポイントクラウドはオクツリーを使用して分割され、特徴抽出のための構造化された入力を提供する。
機能抽出モジュールは適応的な畳み込みレイヤを統合し、オフセットアテンションを使用してローカル機能とグローバル機能の両方をキャプチャする。
そして、形状支援属性特徴改善モジュールを用いて、抽出された属性特徴を洗練する。
最後に,エントロピー符号化のためのグローバルハイパープライアモデルを提案する。
このモデルは、最深層(ベース層)から他の層へハイパープライアパラメータを伝播させ、エンコーディング効率をさらに高める。
デコーダでは、ミラーネットワークを用いて特徴を段階的に復元し、変換された畳み込み層を通じて色属性を再構成する。
提案手法は,低ビットレートでベース層情報を符号化し,徐々に拡張層情報を加えて再構成精度を向上させる。
The latest G-PCC test model (TMC13v23) under the MPEG common test conditions (CTCs)に対し、提案手法は、MPEG Category Solid データセット上の Y 成分 (YUV 組み合わせで 21.23%) に対して平均 Bjontegaard デルタビットレート24.58%、MPEG Category Dense データセット上の 22.48% を達成している。
これは、MPEG CTCでこれらのデータセット上でG-PCC標準を上回る学習ベースのコーデックの最初の例である。
関連論文リスト
- Att2CPC: Attention-Guided Lossy Attribute Compression of Point Clouds [18.244200436103156]
本稿では, オートエンコーダアーキテクチャを利用して, ポイントクラウド属性を効率よく圧縮する手法を提案する。
実験の結果,YチャネルのBD-PSNRとYUVチャネルの平均改善率は1.15dBと2.13dBであることがわかった。
論文 参考訳(メタデータ) (2024-10-23T12:32:21Z) - Point Cloud Compression with Bits-back Coding [32.9521748764196]
本稿では,深層学習に基づく確率モデルを用いて,点雲情報のシャノンエントロピーを推定する。
点雲データセットのエントロピーを推定すると、学習されたCVAEモデルを用いて点雲の幾何学的属性を圧縮する。
本手法の新規性は,CVAEの学習潜在変数モデルを用いて点雲データを圧縮することである。
論文 参考訳(メタデータ) (2024-10-09T06:34:48Z) - End-to-end learned Lossy Dynamic Point Cloud Attribute Compression [5.717288278431968]
本研究では、エンドツーエンドの動的損失属性符号化手法を提案する。
我々は、遅延テンソルをビットストリームに符号化する自動回帰コンテキストモデルとともに、従来の潜時空間を利用するコンテキストモデルを用いる。
論文 参考訳(メタデータ) (2024-08-20T09:06:59Z) - Hierarchical Prior-based Super Resolution for Point Cloud Geometry
Compression [39.052583172727324]
幾何学に基づくポイントクラウド圧縮(G-PCC)は、ポイントクラウドを圧縮するために移動画像専門家グループによって開発された。
本稿では,点雲幾何学的圧縮のための階層的事前分解能超解法を提案する。
論文 参考訳(メタデータ) (2024-02-17T11:15:38Z) - Filter Pruning for Efficient CNNs via Knowledge-driven Differential
Filter Sampler [103.97487121678276]
フィルタプルーニングは同時に計算を加速し、CNNのメモリオーバーヘッドを低減する。
本稿では,MFM(Masked Filter Modeling)フレームワークを用いた知識駆動型微分フィルタサンプリング(KDFS)を提案する。
論文 参考訳(メタデータ) (2023-07-01T02:28:41Z) - GQE-Net: A Graph-based Quality Enhancement Network for Point Cloud Color
Attribute [51.4803148196217]
本稿では,点雲の色歪みを低減するため,グラフベースの品質向上ネットワーク(GQE-Net)を提案する。
GQE-Netは、幾何学情報を補助入力とグラフ畳み込みブロックとして使用し、局所的な特徴を効率的に抽出する。
実験結果から,本手法は最先端性能を実現することが示された。
論文 参考訳(メタデータ) (2023-03-24T02:33:45Z) - SoftPool++: An Encoder-Decoder Network for Point Cloud Completion [93.54286830844134]
本稿では,ポイントクラウド完了作業のための新しい畳み込み演算子を提案する。
提案した演算子は、最大プールやボキセル化操作を一切必要としない。
提案手法は,低解像度・高解像度の形状仕上げにおける最先端性能を実現する。
論文 参考訳(メタデータ) (2022-05-08T15:31:36Z) - Learning Local Displacements for Point Cloud Completion [93.54286830844134]
本稿では,3次元点雲として表現された部分的スキャンからオブジェクトとセマンティックシーンを補完する手法を提案する。
アーキテクチャはエンコーダ-デコーダ構造内で連続的に使用される3つの新しいレイヤに依存している。
オブジェクトと屋内の両方のシーン完了タスクにおけるアーキテクチャの評価を行い、最先端の性能を実現する。
論文 参考訳(メタデータ) (2022-03-30T18:31:37Z) - A new perspective on probabilistic image modeling [92.89846887298852]
本稿では,密度推定,サンプリング,トラクタブル推論が可能な画像モデリングのための新しい確率論的手法を提案する。
DCGMMは、CNNのように、ランダムな初期条件からSGDによってエンドツーエンドに訓練することができる。
本研究は,近年のPCおよびSPNモデルと,推論,分類,サンプリングの観点から比較した。
論文 参考訳(メタデータ) (2022-03-21T14:53:57Z) - Learning-based lossless compression of 3D point cloud geometry [11.69103847045569]
encoderはハイブリッドモードで動作し、octreeとvoxelベースのコーディングを混合する。
提案手法は,最先端MPEG G-PCC規格を平均28%で上回っている。
論文 参考訳(メタデータ) (2020-11-30T11:27:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。