論文の概要: Demystifying KAN for Vision Tasks: The RepKAN Approach
- arxiv url: http://arxiv.org/abs/2603.06002v1
- Date: Fri, 06 Mar 2026 08:01:37 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-09 13:17:45.298646
- Title: Demystifying KAN for Vision Tasks: The RepKAN Approach
- Title(参考訳): ビジョンタスクのためのカンのデミスティフィケーション:RepKANアプローチ
- Authors: Minjong Cheon,
- Abstract要約: RepKANは、CNNの構造効率とKansの非線形表現力を統合する新しいアーキテクチャである。
本稿では、RepKANが物理的に解釈可能な推論を提供しながら、最先端のモデルより優れていることを示す。
- 参考スコア(独自算出の注目度): 3.993449663756884
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Remote sensing image classification is essential for Earth observation, yet standard CNNs and Transformers often function as uninterpretable black-boxes. We propose RepKAN, a novel architecture that integrates the structural efficiency of CNNs with the non-linear representational power of KANs. By utilizing a dual-path design -- Spatial Linear and Spectral Non-linear -- RepKAN enables the autonomous discovery of class-specific spectral fingerprints and physical interaction manifolds. Experimental results on the EuroSAT and NWPU-RESISC45 datasets demonstrate that RepKAN provides explicit physically interpretable reasoning while outperforming state-of-the-art models. These findings indicate that RepKAN holds significant potential to serve as the backbone for future interpretable visual foundation models.
- Abstract(参考訳): リモートセンシング画像分類は地球観測には不可欠であるが、標準的なCNNやトランスフォーマーはしばしば解釈不能なブラックボックスとして機能する。
本稿では,CNNの構造効率とkansの非線形表現力を統合する新しいアーキテクチャであるRepKANを提案する。
デュアルパス設計 – 空間線形およびスペクトル非線形 – を利用することで、RepKANは、クラス固有のスペクトル指紋と物理的相互作用多様体の自律的な発見を可能にする。
EuroSATとNWPU-RESISC45データセットの実験結果は、RepKANが明らかに物理的に解釈可能な推論を提供し、最先端のモデルより優れていることを示している。
これらの結果は、RepKANが将来の解釈可能な視覚基盤モデルのバックボーンとして機能する大きな可能性を秘めていることを示している。
関連論文リスト
- Unveiling the Spatial-temporal Effective Receptive Fields of Spiking Neural Networks [47.413471945080566]
スパイキングニューラルネットワーク(SNN)は、エネルギー効率のよいニューロモルフィックコンピューティングにおいて大きな可能性を示す。
人工ニューラルネットワークでは、有効受容場(ERF)が特徴抽出能力を分析する貴重なツールとして機能する。
本稿では,ST-ERF(Spatio-Temporal Effective Receptive Field)を導入し,トランスフォーマーベースSNN間のRF分布を解析する。
論文 参考訳(メタデータ) (2025-10-24T12:46:58Z) - Suitability of KANs for Computer Vision: A preliminary investigation [28.030708956348864]
Kolmogorov-Arnold Networks (KAN) はニューラルネットワークのパラダイムを導入し、ネットワークの端に学習可能な関数を実装する。
本研究は、視覚モデルにおけるkansの適用性と有効性を評価し、基本的な認識とセグメンテーションタスクに焦点をあてる。
論文 参考訳(メタデータ) (2024-06-13T13:13:17Z) - U-KAN Makes Strong Backbone for Medical Image Segmentation and Generation [48.40120035775506]
Kolmogorov-Arnold Networks (KAN)は、非線形学習可能なアクティベーション関数のスタックを通じてニューラルネットワーク学習を再構築する。
トークン化中間表現であるU-KAN上に専用kan層を統合することにより,確立したU-Netパイプラインを検証,修正,再設計する。
さらに、拡散モデルにおける代替U-Netノイズ予測器としてのU-KANの可能性を探り、タスク指向モデルアーキテクチャの生成にその適用性を実証した。
論文 参考訳(メタデータ) (2024-06-05T04:13:03Z) - Neural Clustering based Visual Representation Learning [61.72646814537163]
クラスタリングは、機械学習とデータ分析における最も古典的なアプローチの1つである。
本稿では,特徴抽出をデータから代表者を選択するプロセスとみなすクラスタリング(FEC)による特徴抽出を提案する。
FECは、個々のクラスタにピクセルをグループ化して抽象的な代表を配置し、現在の代表とピクセルの深い特徴を更新する。
論文 参考訳(メタデータ) (2024-03-26T06:04:50Z) - Unsupervised Interpretable Basis Extraction for Concept-Based Visual Explanations [44.033369364364084]
本研究は,CNN画像分類器の予測と中間層表現を,人間の理解可能な概念の観点から説明しようとするものである。
ボトムアップアプローチを採用し、概念ラベルの監督に頼ることなく、機能空間の構造から方向を一括して識別する。
既存の基盤解釈可能性指標の拡張を行い、抽出したベースに変換すると中間層表現がより解釈可能であることを示す。
論文 参考訳(メタデータ) (2023-03-19T00:37:19Z) - DAIS: Automatic Channel Pruning via Differentiable Annealing Indicator
Search [55.164053971213576]
畳み込みニューラルネットワークは,計算オーバーヘッドが大きいにもかかわらず,コンピュータビジョンタスクの実行において大きな成功を収めている。
構造的(チャネル)プルーニングは、通常、ネットワーク構造を保ちながらモデルの冗長性を低減するために適用される。
既存の構造化プルーニング法では、手作りのルールが必要であり、これは大きなプルーニング空間に繋がる可能性がある。
論文 参考訳(メタデータ) (2020-11-04T07:43:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。