論文の概要: HyMamba: Mamba with Hybrid Geometry-Feature Coupling for Efficient Point Cloud Classification
- arxiv url: http://arxiv.org/abs/2505.11099v2
- Date: Tue, 17 Jun 2025 04:40:21 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-18 17:34:59.098619
- Title: HyMamba: Mamba with Hybrid Geometry-Feature Coupling for Efficient Point Cloud Classification
- Title(参考訳): HyMamba: 効率的なポイントクラウド分類のためのハイブリッド幾何結合型Mamba
- Authors: Bin Liu, Chunyang Wang, Xuelian Liu, Bo Xiao, Guan Xi,
- Abstract要約: Geometry-Feature Coupled Pooling (GFCP)は局所的な特徴に隣接する幾何学的情報を動的に集約する。
提案したモデルは,特にModelNet40データセットにおいて,精度が95.99%に向上し,0.03Mの追加パラメータが得られた。さらに,ModelNetShotデータセットでは98.9%の精度を実現し,スパースサンプル下での堅牢な一般化能力を検証している。
- 参考スコア(独自算出の注目度): 7.139631485661567
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Point cloud classification is one of the essential technologies for achieving intelligent perception of 3D environments by machines, its core challenge is to efficiently extract local and global features. Mamba leverages state space models (SSMs) for global point cloud modeling. Although prior Mamba-based point cloud processing methods pay attention to the limitation of its flattened sequence modeling mechanism in fusing local and global features, the critical issue of weakened local geometric relevance caused by decoupling geometric structures and features in the input patches remains not fully revealed, and both jointly limit local feature extraction. Therefore, we propose HyMamba, a geometry and feature coupled Mamba framework featuring: (1) Geometry-Feature Coupled Pooling (GFCP), which achieves physically interpretable geometric information coupling by dynamically aggregating adjacent geometric information into local features; (2) Collaborative Feature Enhancer (CoFE), which enhances sparse signal capture through cross-path feature hybridization while effectively integrating global and local contexts. We conducted extensive experiments on ModelNet40 and ScanObjectNN datasets. The results demonstrate that the proposed model achieves superior classification performance, particularly on the ModelNet40, where it elevates accuracy to 95.99% with merely 0.03M additional parameters. Furthermore, it attains 98.9% accuracy on the ModelNetFewShot dataset, validating its robust generalization capabilities under sparse samples. Our code and weights are available at https://github.com/L1277471578/HyMamba
- Abstract(参考訳): ポイントクラウド分類は、機械による3D環境のインテリジェントな認識を達成するための重要な技術の一つであり、その中核となる課題は、局所的およびグローバルな特徴を効率的に抽出することである。
Mambaは、グローバルポイントクラウドモデリングにステートスペースモデル(SSM)を活用する。
従来,マンバをベースとした点クラウド処理手法では,局所的特徴と大域的特徴の融合における平坦なシーケンスモデリング機構の限界に注意が向けられていたが,幾何構造と入力パッチの特徴の疎結合による局所的幾何学的関連性の弱さが問題視されている。
そこで我々は,(1)幾何学的・特徴結合型マンバフレームワークであるHyMambaを提案する。(1)幾何学的・特徴結合型プール(GFCP)は,隣接する幾何学的情報を局所的特徴に動的に集約することで物理的に解釈可能な幾何学的情報結合を実現する。(2)協調的特徴エンハンサー(CoFE)は,クロスパス特徴ハイブリダイゼーションによるスパース信号の捕捉を効果的に統合し,グローバルおよびローカルコンテキストを効果的に統合する。
我々はModelNet40とScanObjectNNのデータセットについて広範な実験を行った。
提案モデルでは,特にModelNet40では精度が95.99%向上し,0.03Mの追加パラメータが得られた。
さらに、ModelNetFewShotデータセットの98.9%の精度を獲得し、スパースサンプル下での堅牢な一般化機能を検証する。
私たちのコードと重みはhttps://github.com/L1277471578/HyMambaで公開されています。
関連論文リスト
- PoseMamba: Monocular 3D Human Pose Estimation with Bidirectional Global-Local Spatio-Temporal State Space Model [7.286873011001679]
単眼ビデオにおける複雑な人間のポーズ推定のための線形相関を用いたSSMに基づく純粋手法を提案する。
具体的には、各フレーム内だけでなく、フレーム間の人間の関節関係を包括的にモデル化する、双方向の時間的・時間的ブロックを提案する。
この戦略により、より論理的な幾何学的順序付け戦略が提供され、結果として局所空間スキャンが組み合わせられる。
論文 参考訳(メタデータ) (2024-08-07T04:38:03Z) - Cross-Scan Mamba with Masked Training for Robust Spectral Imaging [51.557804095896174]
本研究では,空間スペクトルSSMを用いたクロススキャンマンバ(CS-Mamba)を提案する。
実験の結果, CS-Mambaは最先端の性能を達成し, マスク付きトレーニング手法によりスムーズな特徴を再構築し, 視覚的品質を向上させることができた。
論文 参考訳(メタデータ) (2024-08-01T15:14:10Z) - Boosting Cross-Domain Point Classification via Distilling Relational Priors from 2D Transformers [59.0181939916084]
従来の3Dネットワークは主に局所幾何学的詳細に焦点を当て、局所幾何学間の位相構造を無視する。
そこで本稿では,大規模画像上においてよく訓練されたトランスフォーマーから前駆体を抽出する,新しい先駆体蒸留法を提案する。
PointDA-10とSim-to-Realデータセットの実験は、提案手法が点クラウド分類におけるUDAの最先端性能を一貫して達成していることを検証する。
論文 参考訳(メタデータ) (2024-07-26T06:29:09Z) - PointABM:Integrating Bidirectional State Space Model with Multi-Head Self-Attention for Point Cloud Analysis [8.500020888201231]
状態空間モデル(SSM)に基づくMambaは、線形複雑性と分類における大きな成功により、3Dポイントクラウド解析においてその優位性を提供する。
Transformerは、ポイントクラウド分析の最も顕著で成功したアーキテクチャの1つとして登場した。
本稿では,3Dポイントクラウド解析の性能向上のために,ローカル機能を強化するために,MambaアーキテクチャとTransformerアーキテクチャを統合したハイブリッドモデルであるPointABMを提案する。
論文 参考訳(メタデータ) (2024-06-10T07:24:22Z) - CWF: Consolidating Weak Features in High-quality Mesh Simplification [50.634070540791555]
これらの要件をすべて同時に検討するスムーズな機能を提案する。
この官能基は、通常の異方性項と、セトロイド型ボロノイテッセルレーション(CVT)エネルギー項を含む。
論文 参考訳(メタデータ) (2024-04-24T05:37:17Z) - Non-linear Independent Dual System (NIDS) for Discretization-independent
Surrogate Modeling over Complex Geometries [0.0]
非線形独立双対系(Non-linear independent dual system、NIDS)は、PDEソリューションの離散化独立で連続的な表現のための深層学習サロゲートモデルである。
NIDSは複雑な可変ジオメトリとメッシュトポロジを持つドメインの予測に使用できる。
テストケースには、複雑な幾何学とデータ不足を伴う車両の問題が含まれており、訓練方法によって実現されている。
論文 参考訳(メタデータ) (2021-09-14T23:38:41Z) - NeuroMorph: Unsupervised Shape Interpolation and Correspondence in One
Go [109.88509362837475]
入力2つの3次元形状を考慮したニューラルネットワークアーキテクチャであるNeuroMorphを提案する。
NeuroMorphはそれらの間のスムーズかつポイントツーポイント対応を生成する。
異なる対象カテゴリの非等尺性ペアを含む、さまざまな入力形状に対してうまく機能する。
論文 参考訳(メタデータ) (2021-06-17T12:25:44Z) - Identification of Probability weighted ARX models with arbitrary domains [75.91002178647165]
PieceWise Affineモデルは、ハイブリッドシステムの他のクラスに対する普遍近似、局所線型性、同値性を保証する。
本研究では,任意の領域を持つ固有入力モデル(NPWARX)を用いたPieceWise Auto Regressiveの同定に着目する。
このアーキテクチャは、機械学習の分野で開発されたMixture of Expertの概念に従って考案された。
論文 参考訳(メタデータ) (2020-09-29T12:50:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。