論文の概要: KAN or MLP? Point Cloud Shows the Way Forward
- arxiv url: http://arxiv.org/abs/2504.13593v1
- Date: Fri, 18 Apr 2025 09:52:22 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-04-28 16:19:49.096753
- Title: KAN or MLP? Point Cloud Shows the Way Forward
- Title(参考訳): Kan か MLP か? Point Cloud が前進の道を示す
- Authors: Yan Shi, Qingdong He, Yijun Liu, Xiaoyu Liu, Jingyong Su,
- Abstract要約: 我々は、クラウド分析タスクにKAN(Kolmogorov-Arnold Learning Networks)を適用したPointKANを提案する。
我々は、ModelNet40、ScanNN、ShapeNetPartなどのベンチマークデータセットにおいて、PointKANがPointMLPより優れていることを示す。
この研究は、3Dビジョンにおけるkansベースのアーキテクチャの可能性を強調し、ポイントクラウド理解における研究のための新たな道を開く。
- 参考スコア(独自算出の注目度): 13.669234791655075
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Multi-Layer Perceptrons (MLPs) have become one of the fundamental architectural component in point cloud analysis due to its effective feature learning mechanism. However, when processing complex geometric structures in point clouds, MLPs' fixed activation functions struggle to efficiently capture local geometric features, while suffering from poor parameter efficiency and high model redundancy. In this paper, we propose PointKAN, which applies Kolmogorov-Arnold Networks (KANs) to point cloud analysis tasks to investigate their efficacy in hierarchical feature representation. First, we introduce a Geometric Affine Module (GAM) to transform local features, improving the model's robustness to geometric variations. Next, in the Local Feature Processing (LFP), a parallel structure extracts both group-level features and global context, providing a rich representation of both fine details and overall structure. Finally, these features are combined and processed in the Global Feature Processing (GFP). By repeating these operations, the receptive field gradually expands, enabling the model to capture complete geometric information of the point cloud. To overcome the high parameter counts and computational inefficiency of standard KANs, we develop Efficient-KANs in the PointKAN-elite variant, which significantly reduces parameters while maintaining accuracy. Experimental results demonstrate that PointKAN outperforms PointMLP on benchmark datasets such as ModelNet40, ScanObjectNN, and ShapeNetPart, with particularly strong performance in Few-shot Learning task. Additionally, PointKAN achieves substantial reductions in parameter counts and computational complexity (FLOPs). This work highlights the potential of KANs-based architectures in 3D vision and opens new avenues for research in point cloud understanding.
- Abstract(参考訳): マルチ層パーセプトロン(MLP)は、その効果的な特徴学習機構により、ポイントクラウド分析における基本的なアーキテクチャコンポーネントの1つとなっている。
しかし、点雲における複雑な幾何学的構造を処理する場合、MPPの固定活性化関数はパラメータ効率の低下とモデル冗長性に悩まされながら、局所幾何学的特徴を効率的に捉えるのに苦労する。
本稿では,KAN(Kolmogorov-Arnold Networks)をクラウド解析タスクに応用し,階層的特徴表現の有効性を検証したPointKANを提案する。
まず,局所的な特徴を変換するための幾何学的アフィンモジュール(GAM)を導入し,モデルのロバスト性を改善した。
次に、ローカル特徴処理(LFP)において、並列構造はグループレベルの特徴とグローバルコンテキストの両方を抽出し、詳細と全体構造の両方をリッチに表現する。
最後に、これらの機能は統合され、Global Feature Processing (GFP)で処理される。
これらの操作を繰り返すことで、受容場は徐々に拡大し、モデルが点雲の完全な幾何学的情報を捉えることができる。
標準kanの高パラメータ数と計算効率を克服するため、PointKAN-elite 変種における効率的なKANを開発し、精度を維持しながらパラメータを著しく削減する。
実験の結果、PointKANはModelNet40、ScanObjectNN、ShapeNetPartなどのベンチマークデータセットでPointMLPよりも優れており、Few-shot Learningタスクでは特に高いパフォーマンスを示している。
さらに、PointKANはパラメータ数と計算複雑性(FLOP)を大幅に削減する。
この研究は、3Dビジョンにおけるkansベースのアーキテクチャの可能性を強調し、ポイントクラウド理解における研究のための新たな道を開く。
関連論文リスト
- Point Cloud Understanding via Attention-Driven Contrastive Learning [64.65145700121442]
トランスフォーマーベースのモデルは、自己認識機構を活用することにより、先進的なポイントクラウド理解を持つ。
PointACLは、これらの制限に対処するために設計された、注意駆動のコントラスト学習フレームワークである。
本手法では, 注意駆動型動的マスキング手法を用いて, モデルが非集中領域に集中するように誘導する。
論文 参考訳(メタデータ) (2024-11-22T05:41:00Z) - PointNet with KAN versus PointNet with MLP for 3D Classification and Segmentation of Point Sets [1.90365714903665]
Kolmogorov-Arnold Networks(KAN)は、ディープラーニングフレームワークにおける従来のマルチレイヤパーセプトロン(MLP)に代わるものとして、最近注目を集めている。
我々は従来のネットワークの代わりに Kan を用いる PointNet-KAN を紹介する。
我々は、Lagrange、Chebyshev、Gegenbauersなど、様々な種類のPointNet-KANを評価した。
論文 参考訳(メタデータ) (2024-10-14T01:57:06Z) - DV-Matcher: Deformation-based Non-Rigid Point Cloud Matching Guided by Pre-trained Visual Features [1.3030624795284795]
DV-Matcherは、非剛性変形点雲間の密接な対応を推定するための学習ベースのフレームワークである。
実験結果から,本手法は非剛性点雲をほぼ等尺形状と異質形状の両方で整合させることで,最先端の結果が得られることがわかった。
論文 参考訳(メタデータ) (2024-08-16T07:02:19Z) - Point Tree Transformer for Point Cloud Registration [33.00645881490638]
ポイントクラウド登録は、コンピュータビジョンとロボティクスの分野における基本的なタスクである。
本稿では,局所的特徴とグローバルな特徴を効率的に抽出する,ポイントクラウド登録のためのトランスフォーマーベースの新しいアプローチを提案する。
本手法は最先端の手法よりも優れた性能を実現する。
論文 参考訳(メタデータ) (2024-06-25T13:14:26Z) - PointMamba: A Simple State Space Model for Point Cloud Analysis [65.59944745840866]
我々は、最近の代表的状態空間モデル(SSM)であるMambaの成功を、NLPからポイントクラウド分析タスクへ転送するPointMambaを提案する。
従来のトランスフォーマーとは異なり、PointMambaは線形複雑性アルゴリズムを採用し、グローバルなモデリング能力を示しながら計算コストを大幅に削減する。
論文 参考訳(メタデータ) (2024-02-16T14:56:13Z) - PointGL: A Simple Global-Local Framework for Efficient Point Cloud
Analysis [19.163081544030547]
我々は、効率的なポイントクラウド分析を容易にするために、PointGLとして知られる、新しく、複雑で、かつ強力なアーキテクチャを導入します。
一点埋め込みとパラメータフリーグラフプーリングの融合は、PointGLが定義するモデル複雑性の最小化と効率の向上に寄与する。
私たちのPointGLは、ScanObjectNNデータセットの最先端の精度を達成しつつ、5倍以上高速で、FLOPの約4%と、最近のPointMLPモデルと比較して30%のパラメータしか利用できないランタイムを示しています。
論文 参考訳(メタデータ) (2024-01-22T02:05:33Z) - Point Deformable Network with Enhanced Normal Embedding for Point Cloud
Analysis [59.12922158979068]
近年,ポイントクラウド解析において高い性能を示す手法が提案されている。
単純なアーキテクチャは局所的な点群で幾何学的特徴を学ぶことができるが、長距離依存を直接モデル化することができない。
本稿では,表現能力の強い長距離関係を捉えるために,PDNet(Point Deformable Network)を提案する。
論文 参考訳(メタデータ) (2023-12-20T14:52:07Z) - PointeNet: A Lightweight Framework for Effective and Efficient Point
Cloud Analysis [28.54939134635978]
PointeNetは、ポイントクラウド分析に特化したネットワークである。
本手法は,分類/分割ヘッドとシームレスに統合したり,市販の3Dオブジェクト検出ネットワークに埋め込んだりすることで,柔軟性を示す。
ModelNet40、ScanObjectNN、ShapeNet KITTI、およびシーンレベルのデータセットKITTIを含むオブジェクトレベルのデータセットの実験は、ポイントクラウド分析における最先端メソッドよりもPointeNetの方が優れたパフォーマンスを示している。
論文 参考訳(メタデータ) (2023-12-20T03:34:48Z) - Human as Points: Explicit Point-based 3D Human Reconstruction from Single-view RGB Images [71.91424164693422]
我々はHaPと呼ばれる明示的なポイントベース人間再構築フレームワークを導入する。
提案手法は,3次元幾何学空間における完全明示的な点雲推定,操作,生成,洗練が特徴である。
我々の結果は、完全に明示的で幾何学中心のアルゴリズム設計へのパラダイムのロールバックを示すかもしれない。
論文 参考訳(メタデータ) (2023-11-06T05:52:29Z) - Bidirectional Knowledge Reconfiguration for Lightweight Point Cloud
Analysis [74.00441177577295]
ポイントクラウド分析は計算システムのオーバーヘッドに直面し、モバイルやエッジデバイスでの利用を制限する。
本稿では,軽量点雲モデルのための特徴蒸留について検討する。
本研究では,教師から生徒への情報的文脈的知識を抽出するための双方向知識再構成を提案する。
論文 参考訳(メタデータ) (2023-10-08T11:32:50Z) - FatNet: A Feature-attentive Network for 3D Point Cloud Processing [1.502579291513768]
本稿では,グローバルポイントベースの機能とエッジベースの機能を組み合わせた,新たな機能指向ニューラルネットワーク層であるfat layerを提案する。
当社のアーキテクチャは,ModelNet40データセットで示すように,ポイントクラウド分類のタスクにおける最先端の成果を達成する。
論文 参考訳(メタデータ) (2021-04-07T23:13:56Z) - SoftPoolNet: Shape Descriptor for Point Cloud Completion and
Classification [93.54286830844134]
本稿では,点雲に基づく3次元オブジェクトの補完と分類手法を提案する。
デコーダの段階では,グローバルな活性化エントロピーの最大化を目的とした新しい演算子である地域畳み込みを提案する。
我々は,オブジェクトの完成度や分類,最先端の精度の達成など,異なる3次元タスクに対するアプローチを評価する。
論文 参考訳(メタデータ) (2020-08-17T14:32:35Z) - Local Grid Rendering Networks for 3D Object Detection in Point Clouds [98.02655863113154]
CNNは強力だが、全点の雲を高密度の3Dグリッドに酸化した後、点データに直接畳み込みを適用するのは計算コストがかかる。
入力点のサブセットの小さな近傍を低解像度の3Dグリッドに独立してレンダリングする,新しい,原理化されたローカルグリッドレンダリング(LGR)演算を提案する。
ScanNetとSUN RGB-Dデータセットを用いた3次元オブジェクト検出のためのLGR-Netを検証する。
論文 参考訳(メタデータ) (2020-07-04T13:57:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。