論文の概要: SLNet: A Super-Lightweight Geometry-Adaptive Network for 3D Point Cloud Recognition
- arxiv url: http://arxiv.org/abs/2603.07454v1
- Date: Sun, 08 Mar 2026 04:07:42 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-10 15:13:14.602869
- Title: SLNet: A Super-Lightweight Geometry-Adaptive Network for 3D Point Cloud Recognition
- Title(参考訳): SLNet:3Dポイントクラウド認識のための超軽量幾何適応ネットワーク
- Authors: Mohammad Saeid, Amir Salarpour, Pedram MohajerAnsari, Mert D. Pesé,
- Abstract要約: SLNetは3Dポイントクラウド認識のための軽量なバックボーンである。
このモデルは、NAPE(Nonparametric Adaptive Point Embedding)とGMU(Geometric Modulation Unit)という2つの単純なアイデアに基づいて構築されている。
- 参考スコア(独自算出の注目度): 1.499944454332829
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We present SLNet, a lightweight backbone for 3D point cloud recognition designed to achieve strong performance without the computational cost of many recent attention, graph, and deep MLP based models. The model is built on two simple ideas: NAPE (Nonparametric Adaptive Point Embedding), which captures spatial structure using a combination of Gaussian RBF and cosine bases with input adaptive bandwidth and blending, and GMU (Geometric Modulation Unit), a per channel affine modulator that adds only 2D learnable parameters. These components are used within a four stage hierarchical encoder with FPS+kNN grouping, nonparametric normalization, and shared residual MLPs. In experiments, SLNet shows that a very small model can still remain highly competitive across several 3D recognition tasks. On ModelNet40, SLNet-S with 0.14M parameters and 0.31 GFLOPs achieves 93.64% overall accuracy, outperforming PointMLP-elite with 5x fewer parameters, while SLNet-M with 0.55M parameters and 1.22 GFLOPs reaches 93.92%, exceeding PointMLP with 24x fewer parameters. On ScanObjectNN, SLNet-M achieves 84.25% overall accuracy within 1.2 percentage points of PointMLP while using 28x fewer parameters. For large scale scene segmentation, SLNet-T extends the backbone with local Point Transformer attention and reaches 58.2% mIoU on S3DIS Area 5 with only 2.5M parameters, more than 17x fewer than Point Transformer V3. We also introduce NetScore+, which extends NetScore by incorporating latency and peak memory so that efficiency can be evaluated in a more deployment oriented way. Across multiple benchmarks and hardware settings, SLNet delivers a strong overall balance between accuracy and efficiency. Code is available at: https://github.com/m-saeid/SLNet.
- Abstract(参考訳): SLNetは3Dポイントクラウド認識のための軽量なバックボーンであり,近年の注目,グラフ,深層MLPモデルによる計算コストを伴わずに高い性能を実現するように設計されている。
モデルは2つの単純なアイデアに基づいて構築されている: NAPE (Nonparametric Adaptive Point Embedding) はガウスRBFとコサインベースの組み合わせと入力適応帯域幅とブレンディングを組み合わせた空間構造をキャプチャし、GMU (Geometric Modulation Unit) は2次元の学習可能なパラメータのみを付加するチャネルアフィン変調器である。
これらのコンポーネントは、FPS+kNNグループ化、非パラメトリック正規化、共有残留MPPを含む4段階の階層エンコーダで使用される。
実験では、SLNetは、非常に小さなモデルがいくつかの3D認識タスクに対して高い競争力を維持することができることを示した。
ModelNet40では、0.14Mパラメータと0.31 GFLOPのSLNet-Sが全体の93.64%の精度を達成し、5倍のパラメータでPointMLP-eliteを上回り、0.55Mパラメータと1.22 GFLOPのSLNet-Mは93.92%に達し、24倍のパラメータでPointMLPを上回る。
ScanObjectNNでは、SLNet-Mは28倍のパラメータを使用しながら、ポイントMLPの1.2ポイントで84.25%の全体的な精度を達成する。
大規模シーンセグメンテーションでは、SLNet-TはローカルのPoint Transformerの注目でバックボーンを拡張し、S3DIS Area 5で58.2% mIoUに達し、パラメータは2.5Mしかなく、Point Transformer V3より17倍少ない。
また、NetScore+を導入し、NetScoreを拡張し、レイテンシとピークメモリを組み込むことで、よりデプロイメント指向の方法で効率を評価できるようにします。
複数のベンチマークとハードウェア設定を通じて、SLNetは精度と効率のバランスを強くする。
コードは、https://github.com/m-saeid/SLNet.comで入手できる。
関連論文リスト
- Efficient Point Cloud Processing with High-Dimensional Positional Encoding and Non-Local MLPs [68.55902504866422]
ポイントクラウド処理におけるモジュラー特徴抽出のための2段階の抽象化・改善(ABSREF)ビューを開発する。
位置情報を明示的に活用するためのHPE(High-stage Positional)モジュールを提案する。
ABSREFの視点では、関係における局所的な集約を再考し、時間を要する局所的な操作を置き換えることを提案する。
論文 参考訳(メタデータ) (2026-03-04T14:12:13Z) - NPNet: A Non-Parametric Network with Adaptive Gaussian-Fourier Positional Encoding for 3D Classification and Segmentation [1.499944454332829]
NPNetは3Dポイントクラウド分類と部分分割のための非パラメトリックアプローチである。
最遠点サンプリング、k-アネレスト隣人、プールなどの決定論的演算子を使って、ポイント機能を構築する。
従来の非パラメトリックな手法と比較して、メモリ使用時間と推論時間が好ましい。
論文 参考訳(メタデータ) (2026-01-31T06:16:19Z) - HLS4PC: A Parametrizable Framework For Accelerating Point-Based 3D Point Cloud Models on FPGA [2.762332196350206]
3Dポイントクラウドモデルは、分類/分離のためのNN層と共に計算とメモリ集約マッピング機能を実行する。
PointMLP-Liteは、ModelNet40の精度がわずか2%の4倍の複雑なバージョンである。
実装はGPUとCPUと比較して2.3倍,22倍高いスループットを実現している。
論文 参考訳(メタデータ) (2025-12-11T17:09:12Z) - LCM: Locally Constrained Compact Point Cloud Model for Masked Point Modeling [47.94285833315427]
本稿では,局所的に制約されたコンパクト・エンコーダと局所的に制約されたMambaベースのデコーダからなる,局所的に制約されたコンパクト・ポイント・クラウド・モデルを提案する。
エンコーダは、パフォーマンスと効率のエレガントなバランスを達成するために、自己アテンションをローカルアグリゲーション層に置き換えます。
このデコーダは、高情報密度の未処理パッチからの点雲幾何学情報の知覚を最大化しつつ、線形複雑性を保証する。
論文 参考訳(メタデータ) (2024-05-27T13:19:23Z) - ParFormer: A Vision Transformer with Parallel Mixer and Sparse Channel Attention Patch Embedding [9.144813021145039]
本稿では、並列ミキサーとスパースチャネル注意パッチ埋め込み(SCAPE)を組み込んだ視覚変換器であるParFormerを紹介する。
ParFormerは、畳み込み機構とアテンション機構を組み合わせることで、特徴抽出を改善する。
エッジデバイスのデプロイメントでは、ParFormer-Tのスループットは278.1イメージ/秒で、EdgeNeXt-Sよりも1.38ドル高い。
より大型のParFormer-Lは83.5%のTop-1精度に達し、精度と効率のバランスの取れたトレードオフを提供する。
論文 参考訳(メタデータ) (2024-03-22T07:32:21Z) - Lightweight and Progressively-Scalable Networks for Semantic
Segmentation [100.63114424262234]
マルチスケール学習フレームワークは,セマンティックセグメンテーションを向上する有効なモデルのクラスと見なされてきた。
本稿では,畳み込みブロックの設計と,複数スケールにわたる相互作用の仕方について,徹底的に解析する。
我々は,軽量で拡張性の高いネットワーク(LPS-Net)を考案した。
論文 参考訳(メタデータ) (2022-07-27T16:00:28Z) - Rethinking Network Design and Local Geometry in Point Cloud: A Simple
Residual MLP Framework [55.40001810884942]
我々は、洗練された局所幾何学的抽出器を組み込んだ純粋な残留ネットワークPointMLPを導入するが、それでも非常に競争力がある。
実世界のScanObjectNNデータセットでは,従来のベストメソッドを3.3%の精度で上回ります。
最新のCurveNetと比較して、PointMLPは2倍速く、テストは7倍速く、ModelNet40ベンチマークではより正確である。
論文 参考訳(メタデータ) (2022-02-15T01:39:07Z) - Compact Multi-level Sparse Neural Networks with Input Independent
Dynamic Rerouting [33.35713740886292]
疎いディープニューラルネットワークは、モデルの複雑さとメモリ消費を大幅に減らすことができる。
現実の課題に直面する中で,複数のスパースレベルをサポートするスパースモデルをトレーニングすることを提案する。
このようにして、推論中に適切なスパーシティレベルを動的に選択でき、ストレージコストを最小のスパースサブモデルで抑えることができる。
論文 参考訳(メタデータ) (2021-12-21T01:35:51Z) - Learning Semantic Segmentation of Large-Scale Point Clouds with Random
Sampling [52.464516118826765]
我々はRandLA-Netを紹介した。RandLA-Netは、大規模ポイントクラウドのポイントごとの意味を推論する、効率的で軽量なニューラルネットワークアーキテクチャである。
我々のアプローチの鍵は、より複雑な点選択アプローチではなく、ランダムな点サンプリングを使用することである。
我々のRandLA-Netは、既存のアプローチよりも最大200倍高速な1回のパスで100万ポイントを処理できます。
論文 参考訳(メタデータ) (2021-07-06T05:08:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。