論文の概要: PAKAN: Pixel Adaptive Kolmogorov-Arnold Network Modules for Pansharpening
- arxiv url: http://arxiv.org/abs/2603.15109v1
- Date: Mon, 16 Mar 2026 11:05:57 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-17 18:28:58.084936
- Title: PAKAN: Pixel Adaptive Kolmogorov-Arnold Network Modules for Pansharpening
- Title(参考訳): PAKAN: パンシャーペン用Pixel Adaptive Kolmogorov-Arnoldネットワークモジュール
- Authors: Haoyu Zhang, Haojing Chen, Zhen Zhong, Liangjian Deng,
- Abstract要約: マルチスペクトル画像のスペクトル情報の豊富なパンクロマティック画像から高分解能空間の詳細を融合するPixel Adaptive Kolmogorov-Arnold Network フレームワークを提案する。
提案モジュールはネットワーク性能を著しく向上させ,パンシャーピング作業における画素適応型アクティベーションの有効性と優位性を証明した。
- 参考スコア(独自算出の注目度): 30.278694964253017
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Pansharpening aims to fuse high-resolution spatial details from panchromatic images with the rich spectral information of multispectral images. Existing deep neural networks for this task typically rely on static activation functions, which limit their ability to dynamically model the complex, non-linear mappings required for optimal spatial-spectral fusion. While the recently introduced Kolmogorov-Arnold Network (KAN) utilizes learnable activation functions, traditional KANs lack dynamic adaptability during inference. To address this limitation, we propose a Pixel Adaptive Kolmogorov-Arnold Network framework. Starting from KAN, we design two adaptive variants: a 2D Adaptive KAN that generates spline summation weights across spatial dimensions and a 1D Adaptive KAN that generates them across spectral channels. These two components are then assembled into PAKAN 2to1 for feature fusion and PAKAN 1to1 for feature refinement. Extensive experiments demonstrate that our proposed modules significantly enhance network performance, proving the effectiveness and superiority of pixel-adaptive activation in pansharpening tasks.
- Abstract(参考訳): Pansharpeningは、マルチスペクトル画像の豊富なスペクトル情報とパンクロマティック画像からの高解像度空間詳細を融合することを目的としている。
このタスクの既存のディープニューラルネットワークは、通常、静的なアクティベーション関数に依存しており、最適な空間-スペクトル融合に必要な複雑な非線形マッピングを動的にモデル化する能力を制限する。
最近導入されたKolmogorov-Arnold Network (KAN) は学習可能なアクティベーション機能を利用しているが、従来のkanは推論中に動的適応性を欠いている。
この制限に対処するため,Pixel Adaptive Kolmogorov-Arnold Networkフレームワークを提案する。
まず,空間次元にまたがるスプライン和重みを生成する2D Adaptive Kanと,スペクトルチャネルにまたがってそれらを生成する1D Adaptive Kanという2つの適応型を設計する。
これら2つのコンポーネントは、機能融合のためにPAKAN 2to1に組み立てられ、機能改善のためにPAKAN 1to1に組み立てられる。
広汎な実験により,提案モジュールはネットワーク性能を著しく向上し,パンシャーピング作業における画素適応型アクティベーションの有効性と優位性を証明した。
関連論文リスト
- DualFlexKAN: Dual-stage Kolmogorov-Arnold Networks with Independent Function Control [2.071516130824992]
Kolmogorov-Arnold Networks (KAN) はこの制限をエッジ中心の学習可能な関数によって解決している。
Kanはパラメータスケーリングとアーキテクチャの剛性に悩まされており、標準正規化技術の効果的な統合を妨げる。
本稿では,DualFlexKAN(DFKAN)について紹介する。DualFlexKAN(DFKAN)は,先線形入力変換と後線形出力を独立に制御するデュアルステージ機構を備えたフレキシブルアーキテクチャである。
論文 参考訳(メタデータ) (2026-03-09T16:36:04Z) - LAKAN: Landmark-assisted Adaptive Kolmogorov-Arnold Network for Face Forgery Detection [48.562984002121276]
ディープフェイク生成技術は 堅牢な顔偽造検出アルゴリズムを必要とする
コルモゴロフ・アルノルドネットワーク(KAN)に基づく新しい検出手法を提案する。
本稿では,ランドマーク支援型適応コルモゴロフ・アルノルドネットワーク(LakaN)モジュールを提案する。
論文 参考訳(メタデータ) (2025-10-01T08:10:38Z) - GCRPNet: Graph-Enhanced Contextual and Regional Perception Network for Salient Object Detection in Optical Remote Sensing Images [68.33481681452675]
本稿では,GCRPNet(Graph-enhanced contextual and Regional Recognition Network)を提案する。
これはMambaアーキテクチャの上に構築され、長距離依存関係を同時にキャプチャし、地域的特徴表現を強化する。
マルチスケールの畳み込みによって処理される特徴マップに対して適応的なパッチスキャンを行い、リッチなローカル領域情報をキャプチャする。
論文 参考訳(メタデータ) (2025-08-14T11:31:43Z) - RAPNet: A Receptive-Field Adaptive Convolutional Neural Network for Pansharpening [2.746409982853943]
本稿では,コンテンツ適応型畳み込みを利用した新しいアーキテクチャであるRAPNetを紹介する。
RAPNetはReceptive-field Adaptive Pansharpening Convolution (RAPConv)を採用している。
ネットワークには Pansharpening Dynamic Feature Fusion (PAN-DFF) モジュールが組み込まれており、空間的詳細化とスペクトルの忠実度を最適にバランスさせるためのアテンション機構が組み込まれている。
論文 参考訳(メタデータ) (2025-07-14T16:39:14Z) - From KAN to GR-KAN: Advancing Speech Enhancement with KAN-Based Methodology [44.61197697979163]
Kolmogorov-Arnold Networks (KAN) の変種である Group-Rational Kan (GR-KAN) は、複雑なタスクのスケーラビリティを改善しながら、kan の表現性を保っている。
我々は、時間周波数(T-F)ドメインMP-SENetの高密度層をGR-KAN層に置き換え、時間周波数(T-F)ドメインの1D CNN層にGR-KANの活性化を適応させることにより、既存のDNNベースのSEにGR-KANを適用する。
Voicebank-DEMANDの結果,GR-KANのパラメータは最大4倍,PESQは最大0.1。
論文 参考訳(メタデータ) (2024-12-23T18:38:32Z) - LeRF: Learning Resampling Function for Adaptive and Efficient Image Interpolation [64.34935748707673]
最近のディープニューラルネットワーク(DNN)は、学習データ前処理を導入することで、パフォーマンスを著しく向上させた。
本稿では,DNNが学習した構造的前提と局所的連続仮定の両方を活かした学習再サンプリング(Learning Resampling, LeRF)を提案する。
LeRFは空間的に異なる再サンプリング関数を入力画像ピクセルに割り当て、ニューラルネットワークを用いてこれらの再サンプリング関数の形状を予測する。
論文 参考訳(メタデータ) (2024-07-13T16:09:45Z) - Cross-receptive Focused Inference Network for Lightweight Image
Super-Resolution [64.25751738088015]
トランスフォーマーに基づく手法は、単一画像超解像(SISR)タスクにおいて顕著な性能を示した。
動的に特徴を抽出するために文脈情報を組み込む必要がある変換器は無視される。
我々は,CNNとTransformerを混合したCTブロックのカスケードで構成される,軽量なクロスレセプティブ・フォーカスド・推論・ネットワーク(CFIN)を提案する。
論文 参考訳(メタデータ) (2022-07-06T16:32:29Z) - Content-aware Directed Propagation Network with Pixel Adaptive Kernel
Attention [20.0783340490331]
画素適応カーネルアテンション(Paka)と呼ばれる新しい操作を提案する。
PAKAは、学習可能な特徴から空間的に異なる注意を掛けることで、フィルタ重みへの指向性を提供する。
本手法はエンドツーエンドで学習可能であり,任意のCNNモデルに適用可能である。
論文 参考訳(メタデータ) (2021-07-28T02:59:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。