論文の概要: Hierarchical Direction Perception via Atomic Dot-Product Operators for Rotation-Invariant Point Clouds Learning
- arxiv url: http://arxiv.org/abs/2511.08240v1
- Date: Wed, 12 Nov 2025 01:48:13 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-12 20:17:03.713018
- Title: Hierarchical Direction Perception via Atomic Dot-Product Operators for Rotation-Invariant Point Clouds Learning
- Title(参考訳): 回転不変点雲学習のための原子ドット生成演算子による階層的方向知覚
- Authors: Chenyu Hu, Xiaotong Li, Hao Zhu, Biao Hou,
- Abstract要約: 任意の回転は点雲の向きのバリエーションを導入し、効果的な表現学習に長年の挑戦を巻き起こす。
点雲のマルチスケール方向特性を利用するために,方向知覚ベクトルネットワーク(DiPVNet)を提案する。
DiPVNetは、ポイントクラウドの分類とセグメンテーションタスクにおける最先端のパフォーマンスを達成する。
- 参考スコア(独自算出の注目度): 23.317876265843605
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Point cloud processing has become a cornerstone technology in many 3D vision tasks. However, arbitrary rotations introduce variations in point cloud orientations, posing a long-standing challenge for effective representation learning. The core of this issue is the disruption of the point cloud's intrinsic directional characteristics caused by rotational perturbations. Recent methods attempt to implicitly model rotational equivariance and invariance, preserving directional information and propagating it into deep semantic spaces. Yet, they often fall short of fully exploiting the multiscale directional nature of point clouds to enhance feature representations. To address this, we propose the Direction-Perceptive Vector Network (DiPVNet). At its core is an atomic dot-product operator that simultaneously encodes directional selectivity and rotation invariance--endowing the network with both rotational symmetry modeling and adaptive directional perception. At the local level, we introduce a Learnable Local Dot-Product (L2DP) Operator, which enables interactions between a center point and its neighbors to adaptively capture the non-uniform local structures of point clouds. At the global level, we leverage generalized harmonic analysis to prove that the dot-product between point clouds and spherical sampling vectors is equivalent to a direction-aware spherical Fourier transform (DASFT). This leads to the construction of a global directional response spectrum for modeling holistic directional structures. We rigorously prove the rotation invariance of both operators. Extensive experiments on challenging scenarios involving noise and large-angle rotations demonstrate that DiPVNet achieves state-of-the-art performance on point cloud classification and segmentation tasks. Our code is available at https://github.com/wxszreal0/DiPVNet.
- Abstract(参考訳): ポイントクラウド処理は多くの3Dビジョンタスクにおいて基盤となる技術になっている。
しかし、任意の回転は点雲の向きのバリエーションを導入し、効果的な表現学習に長年の挑戦を巻き起こした。
この問題の核心は、自転摂動によって引き起こされる点雲の固有の方向特性の破壊である。
近年の手法では、回転同値と不変性を暗黙的にモデル化し、方向情報を保存し、それを深い意味空間に伝播する手法が試みられている。
しかし、それらはしばしば、特徴表現を強化するために、ポイントクラウドのマルチスケール指向性を完全に活用するに足りていない。
そこで本研究では,Direction-Perceptive Vector Network (DiPVNet)を提案する。
中心となるのは、方向選択性と回転不変性を同時に符号化する原子ドット積演算子で、回転対称性モデリングと適応方向知覚の両方でネットワークを変換する。
局所的に学習可能な局所ドット・プロダクツ(L2DP)演算子を導入し,中心点と隣接点との相互作用によって点雲の非一様局所構造を適応的に捕捉する。
大域レベルでは、一般化調和解析を利用して、点雲と球面サンプリングベクトルの間のドット積が方向対応球面フーリエ変換(DASFT)と同値であることを証明する。
これにより、全体論的指向性構造をモデル化するための大域的指向性応答スペクトルが構築される。
両作用素の回転不変性を厳密に証明する。
ノイズと大角回転を含む挑戦的なシナリオに関する大規模な実験は、DiPVNetがポイントクラウドの分類とセグメンテーションタスクにおける最先端のパフォーマンスを達成することを実証している。
私たちのコードはhttps://github.com/wxszreal0/DiPVNet.comで公開されています。
関連論文リスト
- Rotation-Invariant Transformer for Point Cloud Matching [42.5714375149213]
我々は,回転不変変換器であるRoITrを導入し,点クラウドマッチングタスクにおけるポーズ変動に対処する。
本稿では,自己認識機構によって学習した,回転不変なクロスフレーム空間認識を備えたグローバルトランスフォーマーを提案する。
RoITrは、Inlier RatioとRegistration Recallの点で、既存のメソッドを少なくとも13と5のパーセンテージで上回っている。
論文 参考訳(メタデータ) (2023-03-14T20:55:27Z) - General Rotation Invariance Learning for Point Clouds via Weight-Feature
Alignment [40.421478916432676]
局所不変参照フレーム(IRF)を構築するために、ウェイト・フィーチャーアライメント(WFA)を提案する。
我々のWFAアルゴリズムは、すべての場面の点雲に対する一般的な解決策を提供する。
論文 参考訳(メタデータ) (2023-02-20T11:08:07Z) - RIConv++: Effective Rotation Invariant Convolutions for 3D Point Clouds
Deep Learning [32.18566879365623]
3Dポイントクラウドのディープラーニングは、ニューラルネットワークがポイントクラウドの機能を直接学習することのできる、有望な研究分野である。
本稿では,局所領域から強力な回転不変特徴を設計することで特徴の区別を高める,シンプルで効果的な畳み込み演算子を提案する。
ネットワークアーキテクチャは、各畳み込み層の近傍サイズを単純に調整することで、ローカルとグローバルの両方のコンテキストをキャプチャできる。
論文 参考訳(メタデータ) (2022-02-26T08:32:44Z) - PRIN/SPRIN: On Extracting Point-wise Rotation Invariant Features [91.2054994193218]
点群解析における回転不変特徴抽出に着目した点集合学習フレームワークPRINを提案する。
さらに、PRINをスパースポイントクラウド上で直接動作するSPRINと呼ばれるスパースバージョンに拡張します。
その結果、ランダムに回転した点群を持つデータセットでは、SPRINはデータ拡張なしで最先端の方法よりも優れたパフォーマンスを発揮します。
論文 参考訳(メタデータ) (2021-02-24T06:44:09Z) - Learning Rotation-Invariant Representations of Point Clouds Using
Aligned Edge Convolutional Neural Networks [29.3830445533532]
ポイントクラウド分析は、シーンの深さを正確に測定できる3Dセンサーの開発によって、関心が高まる分野である。
点群解析に深層学習技術を適用することは、これらの手法が見えない回転に一般化できないため、簡単ではありません。
この制限に対処するには、通常、トレーニングデータを強化する必要があり、これは余分な計算につながる可能性があり、より大きなモデルの複雑さを必要とする。
本稿では,局所参照フレーム(LRF)に対する点群の特徴表現を学習する,Aligned Edge Convolutional Neural Network(AECNN)と呼ばれる新しいニューラルネットワークを提案する。
論文 参考訳(メタデータ) (2021-01-02T17:36:00Z) - Deep Positional and Relational Feature Learning for Rotation-Invariant
Point Cloud Analysis [107.9979381402172]
点雲解析のための回転不変深層ネットワークを提案する。
ネットワークは階層的であり、位置的特徴埋め込みブロックと関係的特徴埋め込みブロックという2つのモジュールに依存している。
実験では、ベンチマークデータセット上で最先端の分類とセグメンテーション性能を示す。
論文 参考訳(メタデータ) (2020-11-18T04:16:51Z) - A Rotation-Invariant Framework for Deep Point Cloud Analysis [132.91915346157018]
ネットワーク入力時に一般的な3次元カルト座標を置き換えるために,新しい低レベル純粋回転不変表現を導入する。
また,これらの表現を特徴に組み込むネットワークアーキテクチャを提案し,点とその近傍の局所的関係とグローバルな形状構造を符号化する。
本手法は, 形状分類, 部分分割, 形状検索を含む多点雲解析タスクにおいて評価する。
論文 参考訳(メタデータ) (2020-03-16T14:04:45Z) - Quaternion Equivariant Capsule Networks for 3D Point Clouds [58.566467950463306]
本稿では,3次元回転と翻訳に同値な点雲を処理するための3次元カプセルモジュールを提案する。
カプセル間の動的ルーティングをよく知られたWeiszfeldアルゴリズムに接続する。
オペレーターに基づいて、ポーズから幾何学をアンタングルするカプセルネットワークを構築します。
論文 参考訳(メタデータ) (2019-12-27T13:51:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。