論文の概要: PVINet: Point-Voxel Interlaced Network for Point Cloud Compression
- arxiv url: http://arxiv.org/abs/2509.01097v1
- Date: Mon, 01 Sep 2025 03:37:32 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-04 15:17:03.540366
- Title: PVINet: Point-Voxel Interlaced Network for Point Cloud Compression
- Title(参考訳): PVINet:Point Cloud CompressionのためのPoint-Voxel Interlaced Network
- Authors: Xuan Deng, Xingtao Wang, Xiandong Meng, Xiaopeng Fan, Debin Zhao,
- Abstract要約: ポイントクラウド圧縮では、再構成されたポイントクラウドの品質は、グローバル構造とローカルコンテキストの両方に依存している。
本稿では,グローバルな構造的特徴と局所的なコンテキスト的特徴を並列にキャプチャするPVINetを提案する。
PVINetは最先端の手法に比べて競争力がある。
- 参考スコア(独自算出の注目度): 83.74785652597248
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In point cloud compression, the quality of a reconstructed point cloud relies on both the global structure and the local context, with existing methods usually processing global and local information sequentially and lacking communication between these two types of information. In this paper, we propose a point-voxel interlaced network (PVINet), which captures global structural features and local contextual features in parallel and performs interactions at each scale to enhance feature perception efficiency. Specifically, PVINet contains a voxel-based encoder (Ev) for extracting global structural features and a point-based encoder (Ep) that models local contexts centered at each voxel. Particularly, a novel conditional sparse convolution is introduced, which applies point embeddings to dynamically customize kernels for voxel feature extraction, facilitating feature interactions from Ep to Ev. During decoding, a voxel-based decoder employs conditional sparse convolutions to incorporate point embeddings as guidance to reconstruct the point cloud. Experiments on benchmark datasets show that PVINet delivers competitive performance compared to state-of-the-art methods.
- Abstract(参考訳): ポイントクラウド圧縮では、再構成されたポイントクラウドの品質は、グローバル構造とローカルコンテキストの両方に依存し、既存の手法は通常、グローバルおよびローカル情報を逐次処理し、これらの2種類の情報間の通信を欠いている。
本稿では,グローバルな構造的特徴と局所的特徴を並列に捉え,特徴知覚効率を高めるために,各スケールでのインタラクションを行うPVINetを提案する。
具体的には、グローバルな構造特徴を抽出するボクセルベースのエンコーダ(Ev)と、各ボクセルを中心としたローカルコンテキストをモデル化するポイントベースのエンコーダ(Ep)を含む。
特に、新しい条件付きスパース畳み込みが導入され、Voxel特徴抽出のために動的にカーネルをカスタマイズするためにポイント埋め込みを適用し、EpからEvまでの特徴相互作用を容易にする。
デコード中、voxelベースのデコーダは条件付きスパース畳み込みを使用して、ポイントクラウドを再構築するためのガイダンスとしてポイント埋め込みを組み込む。
ベンチマークデータセットの実験では、PVINetは最先端の手法と比較して、競争力のあるパフォーマンスを提供する。
関連論文リスト
- PVNet: Point-Voxel Interaction LiDAR Scene Upsampling Via Diffusion Models [57.02789948234898]
拡散モデルに基づく点-ボクセル相互作用フレームワークであるPVNetを提案する。
具体的には、スパース点雲を誘導条件とし、近くのフレームから得られた合成点雲を入力とする。
さらに,各アップサンプリング点の環境認識能力を効率よく向上する点とボクセルの両方の機能を統合する点とボクセルの相互作用モジュールを提案する。
論文 参考訳(メタデータ) (2025-08-23T14:55:03Z) - PointCFormer: a Relation-based Progressive Feature Extraction Network for Point Cloud Completion [19.503392612245474]
ポイントクラウドの完成は、不完全なポイントクラウドから完全な3D形状を再構築することを目的としている。
PointCFormerは,ロバストなグローバル保持と正確な局所的詳細キャプチャに最適化されたトランスフォーマーフレームワークである。
PointCFormerは、広く使用されているベンチマークで最先端のパフォーマンスを示す。
論文 参考訳(メタデータ) (2024-12-11T14:37:21Z) - Point Cloud Compression with Implicit Neural Representations: A Unified Framework [54.119415852585306]
我々は幾何学と属性の両方を扱える先駆的なクラウド圧縮フレームワークを提案する。
本フレームワークでは,2つの座標ベースニューラルネットワークを用いて,voxelized point cloudを暗黙的に表現する。
本手法は,既存の学習手法と比較して,高い普遍性を示す。
論文 参考訳(メタデータ) (2024-05-19T09:19:40Z) - Collect-and-Distribute Transformer for 3D Point Cloud Analysis [82.03517861433849]
本稿では,点雲の短距離・長距離コンテキストを通信するための収集・分散機構を備えた新しい変圧器ネットワークを提案する。
その結果,提案したCDFormerの有効性が示され,ポイントクラウドの分類とセグメンテーションタスクにおける最先端のパフォーマンスがいくつか提供された。
論文 参考訳(メタデータ) (2023-06-02T03:48:45Z) - VTPNet for 3D deep learning on point cloud [10.470127366415813]
Voxel-Transformer-Point(VTP)ブロックは、ポイントクラウドの局所的およびグローバル的特徴を抽出する。
VTPは、ボクセルベース、ポイントベース、トランスフォーマーベースの方法の利点を組み合わせたものである。
実験の結果、VTPNetは3Dポイントのクラウド学習において優れたパフォーマンスを示している。
論文 参考訳(メタデータ) (2023-05-10T13:07:46Z) - SemAffiNet: Semantic-Affine Transformation for Point Cloud Segmentation [94.11915008006483]
ポイントクラウドセマンティックセグメンテーションのためのSemAffiNetを提案する。
我々はScanNetV2とNYUv2データセットについて広範な実験を行った。
論文 参考訳(メタデータ) (2022-05-26T17:00:23Z) - Point cloud completion on structured feature map with feedback network [28.710494879042002]
本稿では,FSNetを提案する。FSNetは,ポイントワイドな特徴を適応的に2次元構造的特徴マップに集約できる機能構造化モジュールである。
2次元畳み込みニューラルネットワークを用いて、FSNetから粗い完全点クラウドに特徴マップをデコードする。
点雲アップサンプリングネットワークを用いて、部分入力と粗い中間出力から高密度点雲を生成する。
論文 参考訳(メタデータ) (2022-02-17T10:59:40Z) - Fast Point Voxel Convolution Neural Network with Selective Feature
Fusion for Point Cloud Semantic Segmentation [7.557684072809662]
本稿では,ポイントクラウド解析のための軽量畳み込みニューラルネットワークを提案する。
本手法はサンプリングなしで全点集合上で動作し,効率よく性能を向上する。
論文 参考訳(メタデータ) (2021-09-23T19:39:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。