論文の概要: Dynamic 3D KAN Convolution with Adaptive Grid Optimization for Hyperspectral Image Classification
- arxiv url: http://arxiv.org/abs/2504.15155v1
- Date: Mon, 21 Apr 2025 14:57:48 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-04-29 16:09:57.395309
- Title: Dynamic 3D KAN Convolution with Adaptive Grid Optimization for Hyperspectral Image Classification
- Title(参考訳): ハイパースペクトル画像分類のための適応格子最適化を用いた動的3次元カンコンボリューション
- Authors: Guandong Li, Mengxia Ye,
- Abstract要約: Kanetは改良された3D-DenseNetモデルであり、3D Kan Convとアダプティブグリッド更新機構で構成されている。
Kanetはネットワークの深さや幅を増大させることなく、3D動的専門家畳み込みシステムを通じてモデル表現能力を向上させる。
提案手法は、IN, UP, KSCデータセット上での優れた性能を示し、主流のハイパースペクトル画像分類手法よりも優れた性能を示す。
- 参考スコア(独自算出の注目度): 12.168520751389622
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Deep neural networks face several challenges in hyperspectral image classification, including high-dimensional data, sparse distribution of ground objects, and spectral redundancy, which often lead to classification overfitting and limited generalization capability. To more efficiently adapt to ground object distributions while extracting image features without introducing excessive parameters and skipping redundant information, this paper proposes KANet based on an improved 3D-DenseNet model, consisting of 3D KAN Conv and an adaptive grid update mechanism. By introducing learnable univariate B-spline functions on network edges, specifically by flattening three-dimensional neighborhoods into vectors and applying B-spline-parameterized nonlinear activation functions to replace the fixed linear weights of traditional 3D convolutional kernels, we precisely capture complex spectral-spatial nonlinear relationships in hyperspectral data. Simultaneously, through a dynamic grid adjustment mechanism, we adaptively update the grid point positions of B-splines based on the statistical characteristics of input data, optimizing the resolution of spline functions to match the non-uniform distribution of spectral features, significantly improving the model's accuracy in high-dimensional data modeling and parameter efficiency, effectively alleviating the curse of dimensionality. This characteristic demonstrates superior neural scaling laws compared to traditional convolutional neural networks and reduces overfitting risks in small-sample and high-noise scenarios. KANet enhances model representation capability through a 3D dynamic expert convolution system without increasing network depth or width. The proposed method demonstrates superior performance on IN, UP, and KSC datasets, outperforming mainstream hyperspectral image classification approaches.
- Abstract(参考訳): ディープニューラルネットワークは、高次元データ、地上オブジェクトのスパース分布、スペクトル冗長性など、ハイパースペクトル画像分類におけるいくつかの課題に直面しており、しばしば分類過適合と限定的な一般化能力に繋がる。
本稿では, 3D Kan Convと適応グリッド更新機構を組み合わせた改良型3D-DenseNetモデルに基づいて, 画像特徴の抽出と余剰情報をスキップすることなく, 画像特徴の抽出を効率よく行うことを提案する。
学習可能なB-スプライン関数をネットワークエッジ上に導入することにより、特に3次元近傍をベクトルに平坦化し、B-スプラインパラメータ化非線形活性化関数を適用して従来の3次元畳み込みカーネルの固定線形重みを置き換えることで、ハイパースペクトルデータにおける複雑なスペクトル-空間非線形関係を正確に捉える。
同時に、動的グリッド調整機構により、入力データの統計的特性に基づいてB-スプラインの格子点位置を適応的に更新し、スペクトル特徴の不均一分布に一致するようにスプライン関数の分解を最適化し、高次元データモデリングおよびパラメータ効率におけるモデルの精度を大幅に改善し、次元の呪いを効果的に軽減する。
この特徴は、従来の畳み込みニューラルネットワークと比較して優れたニューラルネットワークスケーリング法則を示し、小さなサンプルやハイノイズのシナリオにおいて過度に適合するリスクを低減する。
Kanetはネットワークの深さや幅を増大させることなく、3D動的専門家畳み込みシステムを通じてモデル表現能力を向上させる。
提案手法は、IN, UP, KSCデータセット上での優れた性能を示し、主流のハイパースペクトル画像分類手法よりも優れた性能を示す。
関連論文リスト
- Expert Kernel Generation Network Driven by Contextual Mapping for Hyperspectral Image Classification [12.168520751389622]
ディープニューラルネットワークは、高次元データ、地上オブジェクトのスパース分布、スペクトル冗長性など、ハイパースペクトル画像分類においていくつかの課題に直面している。
本稿では,コンテキスト認識型マッピングネットワークと動的カーネル生成モジュールで構成される改良型3D-DenseNetモデルに基づくEKGNetを提案する。
提案手法は、IN, UP, KSCデータセット上での優れた性能を示し、主流のハイパースペクトル画像分類手法よりも優れた性能を示す。
論文 参考訳(メタデータ) (2025-04-17T16:00:06Z) - 3D Wavelet Convolutions with Extended Receptive Fields for Hyperspectral Image Classification [12.168520751389622]
ディープニューラルネットワークは、ハイパースペクトル画像分類において多くの課題に直面している。
本稿ではウェーブレット変換と統合された改良型3D-DenseNetモデルWCNetを提案する。
実験結果から,IN,UP,KSCデータセットにおいて優れた性能を示した。
論文 参考訳(メタデータ) (2025-04-15T01:39:42Z) - Spatial-Geometry Enhanced 3D Dynamic Snake Convolutional Neural Network for Hyperspectral Image Classification [12.168520751389622]
ディープニューラルネットワークは、ハイパースペクトル画像分類においていくつかの課題に直面している。
これには、複雑でスパースな地上オブジェクト分布、小さなクラスタ構造、細長いマルチブランチ機能が含まれる。
本稿では,改良された3次元DenseNetモデルに基づく空間幾何学拡張3次元ダイナミックスネークネットワーク(SG-DSCNet)を提案する。
論文 参考訳(メタデータ) (2025-04-06T12:21:39Z) - Efficient Dynamic Attention 3D Convolution for Hyperspectral Image Classification [12.168520751389622]
本稿では,改良された3D-DenseNetモデルに基づく動的アテンション畳み込み設計を提案する。
この設計では、単一のカーネルの代わりに複数の並列畳み込みカーネルを使用し、これらの並列畳み込みに動的注意重みを割り当てる。
提案手法は、IN, UP, KSCデータセットにおいて、主流のハイパースペクトル画像分類法よりも優れた性能を示す。
論文 参考訳(メタデータ) (2025-03-30T15:12:23Z) - Hyperspectral Images Efficient Spatial and Spectral non-Linear Model with Bidirectional Feature Learning [7.06787067270941]
本稿では,分類精度を高めつつ,データ量を大幅に削減する新しいフレームワークを提案する。
本モデルでは,空間特徴解析のための特殊ブロックによって補完されるスペクトル特徴を効率よく抽出するために,双方向逆畳み込みニューラルネットワーク(CNN)を用いる。
論文 参考訳(メタデータ) (2024-11-29T23:32:26Z) - Geometric Algebra Planes: Convex Implicit Neural Volumes [70.12234371845445]
GA-Planes はスパース低ランク係数と低分解能行列と等価であることを示す。
また,GA-Planeは既存の表現にも適用可能であることを示す。
論文 参考訳(メタデータ) (2024-11-20T18:21:58Z) - 3D Equivariant Pose Regression via Direct Wigner-D Harmonics Prediction [50.07071392673984]
既存の方法は、角度や四元数を用いて空間領域でパラメータ化された3次元回転を学習する。
本稿では,3次元回転回帰のためのWigner-D係数を直接予測する周波数領域アプローチを提案する。
提案手法は, ModelNet10-SO(3) や PASCAL3D+ などのベンチマーク上での最先端結果を実現する。
論文 参考訳(メタデータ) (2024-11-01T12:50:38Z) - Learned Vertex Descent: A New Direction for 3D Human Model Fitting [64.04726230507258]
画像やスキャンに適合する3次元人体モデルのための新しい最適化手法を提案する。
われわれのアプローチは、非常に異なる体型を持つ服を着た人々の基盤となる身体を捉えることができ、最先端技術と比べて大きな改善を達成できる。
LVDはまた、人間と手の3次元モデル適合にも適用でき、よりシンプルで高速な方法でSOTAに大きな改善が示される。
論文 参考訳(メタデータ) (2022-05-12T17:55:51Z) - FS-Net: Fast Shape-based Network for Category-Level 6D Object Pose
Estimation with Decoupled Rotation Mechanism [49.89268018642999]
6次元ポーズ推定のための効率的なカテゴリレベルの特徴抽出が可能な高速形状ベースネットワーク(FS-Net)を提案する。
提案手法は,カテゴリレベルおよびインスタンスレベルの6Dオブジェクトのポーズ推定における最先端性能を実現する。
論文 参考訳(メタデータ) (2021-03-12T03:07:24Z) - Learning Local Neighboring Structure for Robust 3D Shape Representation [143.15904669246697]
3Dメッシュの表現学習は多くのコンピュータビジョンやグラフィックスアプリケーションにおいて重要である。
局所構造認識型異方性畳み込み操作(LSA-Conv)を提案する。
本モデルでは,3次元形状復元において最先端の手法に比べて顕著な改善が得られた。
論文 参考訳(メタデータ) (2020-04-21T13:40:03Z) - Spatial-Spectral Residual Network for Hyperspectral Image
Super-Resolution [82.1739023587565]
ハイパースペクトル画像超解像のための新しいスペクトル空間残差ネットワーク(SSRNet)を提案する。
提案手法は,2次元畳み込みではなく3次元畳み込みを用いて空間スペクトル情報の探索を効果的に行うことができる。
各ユニットでは空間的・時間的分離可能な3次元畳み込みを用いて空間的・スペクトル的な情報を抽出する。
論文 参考訳(メタデータ) (2020-01-14T03:34:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。