論文の概要: 3D Fourier-based Global Feature Extraction for Hyperspectral Image Classification
- arxiv url: http://arxiv.org/abs/2603.16426v1
- Date: Tue, 17 Mar 2026 12:02:28 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-18 17:42:07.259134
- Title: 3D Fourier-based Global Feature Extraction for Hyperspectral Image Classification
- Title(参考訳): ハイパースペクトル画像分類のための3次元フーリエによるグローバル特徴抽出
- Authors: Muhammad Ahmad,
- Abstract要約: 本稿では,局所的な3次元畳み込み特徴抽出と周波数領域グローバルフィルタリングを統合した新しいアーキテクチャであるHybrid GFNetを提案する。
3次元畳み込み層は微細な局所空間スペクトル構造を捉え、フーリエのグローバルフィルタリングモジュールは長距離依存性を効率的にモデル化しノイズを抑制する。
HGFNetは、HSICでよく見られる重度のクラス不均衡を緩和するために、適応的焦点損失(Adaptive Focal Loss, AFL)を導入し、クラスワイドの焦点と重み付けを動的に調整する。
- 参考スコア(独自算出の注目度): 4.139698879651128
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Hyperspectral image classification (HSIC) has been significantly advanced by deep learning methods that exploit rich spatial-spectral correlations. However, existing approaches still face fundamental limitations: transformer-based models suffer from poor scalability due to the quadratic complexity of self-attention, while recent Fourier transform-based methods typically rely on 2D spatial FFTs and largely ignore critical inter-band spectral dependencies inherent to hyperspectral data. To address these challenges, we propose Hybrid GFNet (HGFNet), a novel architecture that integrates localized 3D convolutional feature extraction with frequency-domain global filtering via GFNet-style blocks for efficient and robust spatial-spectral representation learning. HGFNet introduces three complementary frequency transforms tailored to hyperspectral imagery: Spectral Fourier Transform (a 1D FFT along the spectral axis), Spatial Fourier Transform (a 2D FFT over spatial dimensions), and Spatial-Spatial Fourier Transform (a 3D FFT jointly over spectral and spatial dimensions), enabling comprehensive and high-dimensional frequency modeling. The 3D convolutional layers capture fine-grained local spatial-spectral structures, while the Fourier-based global filtering modules efficiently model long-range dependencies and suppress noise. To further mitigate the severe class imbalance commonly observed in HSIC, HGFNet incorporates an Adaptive Focal Loss (AFL) that dynamically adjusts class-wise focusing and weighting, improving discrimination for underrepresented classes.
- Abstract(参考訳): ハイパースペクトル画像分類(HSIC)は、豊富な空間スペクトル相関を利用する深層学習法によって大幅に進歩している。
しかし、トランスフォーマーベースのモデルでは、自己注意の二次的な複雑さのためにスケーラビリティが劣る一方、最近のフーリエ変換ベースの手法は、通常は2次元空間FFTに依存し、ハイパースペクトルデータに固有の重要なバンド間スペクトル依存を無視している。
これらの課題に対処するため,Hybrid GFNet(Hybrid GFNet:Hybrid GFNet)を提案する。
HGFNetは、スペクトルフーリエ変換(スペクトル軸に沿って1次元FFT)、空間フーリエ変換(空間次元を2次元FFT)、空間空間空間フーリエ変換(スペクトルと空間次元を共同で3次元FFT)の3つの相補的な周波数変換を導入し、包括的かつ高次元の周波数モデリングを可能にする。
3次元畳み込み層は微細な局所空間スペクトル構造を捉え、フーリエのグローバルフィルタリングモジュールは長距離依存性を効率的にモデル化しノイズを抑制する。
HGFNetは、HSICでよく見られる重度のクラス不均衡を緩和するため、適応的焦点損失(Adaptive Focal Loss, AFL)を導入し、クラスワイドの焦点と重み付けを動的に調整し、表現不足のクラスに対する差別を改善する。
関連論文リスト
- Hybrid-Domain Synergistic Transformer for Hyperspectral Image Denoising [3.7420648748151977]
本稿では,周波数領域拡張とマルチスケールモデリングに基づくHSIデノナイズフレームワークであるHybrid-Domain Synergistic Transformer Network (HDST)を提案する。
実データと合成データの両方の実験により、HDSTはデノイング性能を著しく改善することが示された。
本研究は,HSIやその他の高次元視覚データにおける複雑なノイズカップリング問題に対処するための新たな洞察と普遍的な枠組みを提供する。
論文 参考訳(メタデータ) (2025-07-27T01:45:29Z) - 3D Wavelet Convolutions with Extended Receptive Fields for Hyperspectral Image Classification [12.168520751389622]
ディープニューラルネットワークは、ハイパースペクトル画像分類において多くの課題に直面している。
本稿ではウェーブレット変換と統合された改良型3D-DenseNetモデルWCNetを提案する。
実験結果から,IN,UP,KSCデータセットにおいて優れた性能を示した。
論文 参考訳(メタデータ) (2025-04-15T01:39:42Z) - SparseFlex: High-Resolution and Arbitrary-Topology 3D Shape Modeling [79.56581753856452]
SparseFlexは、新しいスパース構造のアイソサーフェス表現で、レンダリング損失から最大10243ドルの解像度で、差別化可能なメッシュ再構築を可能にする。
SparseFlexは、高解像度で差別化可能なメッシュ再構成とレンダリングロスによる生成を可能にすることで、3D形状の表現とモデリングの最先端性を著しく向上させる。
論文 参考訳(メタデータ) (2025-03-27T17:46:42Z) - DiffFormer: a Differential Spatial-Spectral Transformer for Hyperspectral Image Classification [3.271106943956333]
超スペクトル画像分類(HSIC)は、高次元データをスペクトル情報と空間情報で分析する可能性から注目されている。
本稿では、スペクトル冗長性や空間不連続性といったHSICの固有の課題に対処するために、差分空間スペクトル変換器(DiffFormer)を提案する。
ベンチマークハイパースペクトルデータセットの実験は、分類精度、計算効率、一般化可能性の観点から、DiffFormerの優位性を示す。
論文 参考訳(メタデータ) (2024-12-23T07:21:41Z) - FOF-X: Towards Real-time Detailed Human Reconstruction from a Single Image [64.96903230497755]
本稿では,1枚の画像から詳細な人物形状をリアルタイムに再現するFOF-Xを提案する。
FOFの中核は、3次元占有体を2次元ベクトル場に分解し、3次元領域内の位相的および空間的関係を維持することである。
FOFに基づく新しい再構成フレームワークFOF-Xを設計し,テクスチャや照明による性能劣化を回避する。
論文 参考訳(メタデータ) (2024-12-08T14:46:29Z) - Spectral Enhanced Rectangle Transformer for Hyperspectral Image
Denoising [64.11157141177208]
ハイパースペクトル画像の空間的およびスペクトル的相関をモデル化するスペクトル拡張矩形変換器を提案する。
前者に対しては、長方形自己アテンションを水平および垂直に利用し、空間領域における非局所的類似性を捉える。
後者のために,空間スペクトル立方体の大域的低ランク特性を抽出し,雑音を抑制するスペクトル拡張モジュールを設計する。
論文 参考訳(メタデータ) (2023-04-03T09:42:13Z) - Dynamic Temporal Filtering in Video Models [128.02725199486719]
時間的特徴学習の新しいレシピである動的時間フィルタ(DTF)を提案する。
DTFは、その長距離時間ダイナミクスをモデル化するために、空間的位置ごとに特別な周波数フィルタを学習する。
DTFブロックをConvNetsとTransformerにプラグインすることで、DTF-NetとDTF-Transformerが得られる。
論文 参考訳(メタデータ) (2022-11-15T15:59:28Z) - Deep Fourier Up-Sampling [100.59885545206744]
フーリエ領域のアップサンプリングは、そのような局所的な性質に従わないため、より難しい。
これらの問題を解決するために理論的に健全なDeep Fourier Up-Sampling (FourierUp)を提案する。
論文 参考訳(メタデータ) (2022-10-11T06:17:31Z) - Global Filter Networks for Image Classification [90.81352483076323]
本稿では,対数線形複雑度を持つ周波数領域における長期空間依存性を学習する,概念的に単純だが計算効率のよいアーキテクチャを提案する。
この結果から,GFNetはトランスフォーマー型モデルやCNNの効率,一般化能力,堅牢性において,非常に競争力のある代替手段となる可能性が示唆された。
論文 参考訳(メタデータ) (2021-07-01T17:58:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。