論文の概要: HydraMamba: Multi-Head State Space Model for Global Point Cloud Learning
- arxiv url: http://arxiv.org/abs/2507.19778v1
- Date: Sat, 26 Jul 2025 04:04:22 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-29 16:23:56.183957
- Title: HydraMamba: Multi-Head State Space Model for Global Point Cloud Learning
- Title(参考訳): HydraMamba:グローバルポイントクラウド学習のためのマルチヘッド状態空間モデル
- Authors: Kanglin Qu, Pan Gao, Qun Dai, Yuanhao Sun,
- Abstract要約: 我々はHydraMambaと呼ばれる状態空間モデルに基づくポイントクラウドネットワークを探索する。
具体的にはシャッフルシリアライズ戦略を設計し、不順序点集合をS6の因果性に適応させる。
局所学習における既存の手法の欠如を克服するため,我々はConvBiS6層を提案する。
- 参考スコア(独自算出の注目度): 10.222538107515547
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The attention mechanism has become a dominant operator in point cloud learning, but its quadratic complexity leads to limited inter-point interactions, hindering long-range dependency modeling between objects. Due to excellent long-range modeling capability with linear complexity, the selective state space model (S6), as the core of Mamba, has been exploited in point cloud learning for long-range dependency interactions over the entire point cloud. Despite some significant progress, related works still suffer from imperfect point cloud serialization and lack of locality learning. To this end, we explore a state space model-based point cloud network termed HydraMamba to address the above challenges. Specifically, we design a shuffle serialization strategy, making unordered point sets better adapted to the causal nature of S6. Meanwhile, to overcome the deficiency of existing techniques in locality learning, we propose a ConvBiS6 layer, which is capable of capturing local geometries and global context dependencies synergistically. Besides, we propose MHS6 by extending the multi-head design to S6, further enhancing its modeling capability. HydraMamba achieves state-of-the-art results on various tasks at both object-level and scene-level. The code is available at https://github.com/Point-Cloud-Learning/HydraMamba.
- Abstract(参考訳): 注意機構は点クラウド学習において支配的な演算子となっているが、その二次的な複雑さは点間相互作用を制限し、オブジェクト間の長距離依存性モデリングを妨げている。
線形複雑性を伴う長距離モデリング能力に優れており、選択状態空間モデル(S6)は、Mambaのコアとして、ポイントクラウド全体にわたる長距離依存インタラクションのためのポイントクラウド学習に活用されている。
いくつかの大きな進歩にもかかわらず、関連する研究はいまだに不完全な点のクラウドシリアライゼーションと局所学習の欠如に悩まされている。
この目的のために,HydraMambaと呼ばれる状態空間モデルに基づくポイントクラウドネットワークを探索し,上記の課題に対処する。
具体的にはシャッフルシリアライズ戦略を設計し、不順序点集合をS6の因果性に適応させる。
一方、局所学習における既存の手法の欠如を克服するため、局所的ジオメトリとグローバルな文脈依存を相乗的に捉えることができるConvBiS6層を提案する。
さらに,マルチヘッド設計をS6に拡張し,モデリング能力をさらに向上させることにより,MHS6を提案する。
HydraMambaは、オブジェクトレベルとシーンレベルの両方で、さまざまなタスクにおける最先端の結果を達成する。
コードはhttps://github.com/Point-Cloud-Learning/HydraMambaで公開されている。
関連論文リスト
- PointLAMA: Latent Attention meets Mamba for Efficient Point Cloud Pretraining [8.906813021681135]
Mambaは最近、ポイントクラウドモデリングのバックボーンモデルとして広く注目を集めており、線形複雑性を伴う効率的なグローバルシーケンスモデリングを可能にするステートスペースアーキテクチャを活用している。
我々は,タスク対応のポイントクラウドシリアライゼーションを組み込んだポイントクラウド事前学習フレームワークであるtextbfPointLAMA,Latent AttentionとMambaブロックを統合したハイブリッドエンコーダ,Mambaバックボーン上に構築された条件拡散機構を提案する。
論文 参考訳(メタデータ) (2025-07-23T07:57:35Z) - StruMamba3D: Exploring Structural Mamba for Self-supervised Point Cloud Representation Learning [31.585380521480868]
自己教師付きポイントクラウド表現学習のための新しいパラダイムであるStruMamba3Dを提案する。
空間状態を設計し,それらをプロキシとして用いて点間の空間的依存関係を保存する。
提案手法は,ModelNet40上でのSOTA 95.1%の精度と,投票戦略を使わずに最も難しい分割ScanObjectNN上での92.75%の精度を実現する。
論文 参考訳(メタデータ) (2025-06-26T17:58:05Z) - PMA: Towards Parameter-Efficient Point Cloud Understanding via Point Mamba Adapter [54.33433051500349]
本稿では,事前学習モデルのすべての層から順序付き特徴系列を構成するPMAを提案する。
また、異なる層にまたがって共有される幾何学制約ゲートプロンプトジェネレータ(G2PG)を提案する。
論文 参考訳(メタデータ) (2025-05-27T09:27:16Z) - CollaMamba: Efficient Collaborative Perception with Cross-Agent Spatial-Temporal State Space Model [12.461378793357705]
マルチエージェント協調認識は環境のより深い理解を促進する。
協調知覚の最近の研究は、主にCNNやトランスフォーマーを用いて空間次元における特徴表現と融合を学習している。
資源効率の良い時間空間協調状態空間モデルCollaMambaを提案する。
論文 参考訳(メタデータ) (2024-09-12T02:50:04Z) - Pamba: Enhancing Global Interaction in Point Clouds via State Space Model [37.375866491592305]
我々は、SSMベースのアーキテクチャであるMambaをポイントクラウドドメインに導入し、線形複雑性の下で強力なグローバルモデリング機能を備えた新しいアーキテクチャであるPambaを提案する。
Pambaは、ScanNet v2、ScanNet200、S3DIS、nuScenesなど、いくつかの3Dポイントクラウドセグメンテーションタスクの最先端結果を取得する。
論文 参考訳(メタデータ) (2024-06-25T10:23:53Z) - Point Mamba: A Novel Point Cloud Backbone Based on State Space Model with Octree-Based Ordering Strategy [15.032048930130614]
我々は、因果性を考慮した注文機構を備えた、新しいSSMベースのポイントクラウド処理バックボーン、Point Mambaを提案する。
本手法は, 変圧器をベースとした変圧器と比較して, 93.4%の精度と75.7mIOUの精度を実現している。
提案手法は,SSMが点雲理解において一般的なバックボーンとして機能する可能性を示す。
論文 参考訳(メタデータ) (2024-03-11T07:07:39Z) - Point Cloud Mamba: Point Cloud Learning via State Space Model [73.7454734756626]
我々は,マンバをベースとしたポイントクラウド法が,トランスフォーマや多層パーセプトロン(MLP)に基づく従来手法よりも優れていることを示す。
特に,マルチ層パーセプトロン(MLP)を用いて,マンバをベースとした点雲法が従来手法より優れていることを示す。
Point Cloud Mambaは、最先端(SOTA)のポイントベースメソッドであるPointNeXtを超え、ScanNN、ModelNet40、ShapeNetPart、S3DISデータセット上での新たなSOTAパフォーマンスを達成する。
論文 参考訳(メタデータ) (2024-03-01T18:59:03Z) - PointMamba: A Simple State Space Model for Point Cloud Analysis [65.59944745840866]
我々は、最近の代表的状態空間モデル(SSM)であるMambaの成功を、NLPからポイントクラウド分析タスクへ転送するPointMambaを提案する。
従来のトランスフォーマーとは異なり、PointMambaは線形複雑性アルゴリズムを採用し、グローバルなモデリング能力を示しながら計算コストを大幅に削減する。
論文 参考訳(メタデータ) (2024-02-16T14:56:13Z) - Explore In-Context Learning for 3D Point Cloud Understanding [71.20912026561484]
我々は,特に3Dポイントクラウドにおけるコンテキスト内学習のために設計された,ポイント・イン・コンテキストという新しいフレームワークを紹介した。
一般点サンプリング演算子とタンデムで協調して動作するように慎重に設計したJoint Smplingモジュールを提案する。
提案手法の汎用性と適応性を検証するため,幅広いタスクを扱うための広範囲な実験を行った。
論文 参考訳(メタデータ) (2023-06-14T17:53:21Z) - StarNet: Style-Aware 3D Point Cloud Generation [82.30389817015877]
StarNetは、マッピングネットワークを使用して高忠実度および3Dポイントクラウドを再構築し、生成することができる。
我々のフレームワークは、クラウドの再構築と生成タスクにおいて、様々なメトリクスで同等の最先端のパフォーマンスを達成します。
論文 参考訳(メタデータ) (2023-03-28T08:21:44Z) - Pseudo-LiDAR Point Cloud Interpolation Based on 3D Motion Representation
and Spatial Supervision [68.35777836993212]
我々はPseudo-LiDAR点雲ネットワークを提案し、時間的および空間的に高品質な点雲列を生成する。
点雲間のシーンフローを活用することにより,提案ネットワークは3次元空間運動関係のより正確な表現を学習することができる。
論文 参考訳(メタデータ) (2020-06-20T03:11:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。