論文の概要: Cosine-Normalized Attention for Hyperspectral Image Classification
- arxiv url: http://arxiv.org/abs/2604.01763v1
- Date: Thu, 02 Apr 2026 08:32:12 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-03 14:21:10.614503
- Title: Cosine-Normalized Attention for Hyperspectral Image Classification
- Title(参考訳): ハイパースペクトル画像分類のためのCosine-Normalized Attention
- Authors: Muhammad Ahmad, Manuel Mazzara,
- Abstract要約: トランスフォーマーに基づく手法は、長距離空間スペクトル依存性をモデル化することにより、ハイパースペクトル画像分類(HSIC)を改善した。
本研究は、幾何学的視点から注目スコアを見直し、コサイン正規化注意定式化を導入する。
3つのベンチマークデータセットの実験は、提案手法が一貫して高い性能を達成することを示した。
- 参考スコア(独自算出の注目度): 7.170991480063844
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Transformer-based methods have improved hyperspectral image classification (HSIC) by modeling long-range spatial-spectral dependencies; however, their attention mechanisms typically rely on dot-product similarity, which mixes feature magnitude and orientation and may be suboptimal for hyperspectral data. This work revisits attention scoring from a geometric perspective and introduces a cosine-normalized attention formulation that aligns similarity computation with the angular structure of hyperspectral signatures. By projecting query and key embeddings onto a unit hypersphere and applying a squared cosine similarity, the proposed method emphasizes angular relationships while reducing sensitivity to magnitude variations. The formulation is integrated into a spatial-spectral Transformer and evaluated under extremely limited supervision. Experiments on three benchmark datasets demonstrate that the proposed approach consistently achieves higher performance, outperforming several recent Transformer- and Mamba-based models despite using a lightweight backbone. In addition, a controlled analysis of multiple attention score functions shows that cosine-based scoring provides a reliable inductive bias for hyperspectral representation learning.
- Abstract(参考訳): トランスフォーマーベースの手法は、長距離空間スペクトル依存性をモデル化することで、ハイパースペクトル画像分類(HSIC)を改善したが、その注意機構は、通常はドット積の類似性に依存しており、特徴量と向きを混合し、ハイパースペクトルデータに最適である可能性がある。
この研究は、幾何学的視点から注目スコアを見直し、類似性計算と超スペクトルシグネチャの角構造を整列するコサイン正規化注意定式化を導入する。
クエリとキーの埋め込みを単位超球面に投影し、正方形コサイン類似性を適用することにより、大域変動に対する感度を低減しつつ、角関係を強調する。
定式化は空間スペクトル変換器に統合され、極めて限られた監督下で評価される。
3つのベンチマークデータセットの実験により、提案されたアプローチは、軽量なバックボーンを使用しても、最近のTransformerおよびMambaベースのモデルよりも優れたパフォーマンスを実現していることが示された。
さらに,マルチアテンションスコア関数の制御分析により,コサインに基づくスコアリングが高スペクトル表現学習に信頼性のある帰納的バイアスを与えることが示された。
関連論文リスト
- Rectifying Geometry-Induced Similarity Distortions for Real-World Aerial-Ground Person Re-Identification [4.039576422478934]
航空地上人物再識別(AG-ReID)は、極端な視点と距離の相違により根本的な課題である。
既存の手法は幾何学的特徴学習や外観条件付きプロンプトに依存している。
Geometry-induced Query-Key Transformation (GIQT) は、カメラ幾何学におけるクエリキーの相互作用を条件に、類似性空間を補正する軽量な低ランクモジュールである。
論文 参考訳(メタデータ) (2026-01-29T08:41:42Z) - Cross-attention Secretly Performs Orthogonal Alignment in Recommendation Models [32.476422580370375]
クロスドメインシーケンシャルレコメンデーションは、異なるドメインから収集された異種ユーザ行動シーケンスを整列することを目的としている。
ほとんどの研究者は、クロスアテンションを残差アライメントと解釈し、冗長な情報を取り除き、非冗長な情報を保存することによって出力を生成する。
本稿では,クエリ入力に存在しない新しい情報を相互に関連付ける現象であるorthogonal Alignmentを紹介する。
論文 参考訳(メタデータ) (2025-10-10T14:45:39Z) - DiffFormer: a Differential Spatial-Spectral Transformer for Hyperspectral Image Classification [3.271106943956333]
超スペクトル画像分類(HSIC)は、高次元データをスペクトル情報と空間情報で分析する可能性から注目されている。
本稿では、スペクトル冗長性や空間不連続性といったHSICの固有の課題に対処するために、差分空間スペクトル変換器(DiffFormer)を提案する。
ベンチマークハイパースペクトルデータセットの実験は、分類精度、計算効率、一般化可能性の観点から、DiffFormerの優位性を示す。
論文 参考訳(メタデータ) (2024-12-23T07:21:41Z) - Transformers Fusion across Disjoint Samples for Hyperspectral Image Classification [2.1223532600703385]
3Dスウィントランス(3D-ST)は、画像内の複雑な空間的関係を捉えるのに優れる。
SSTは、自己アテンション機構による長距離依存関係のモデリングを専門とする。
本稿では、ハイパースペクトル画像(HSI)の分類性能を大幅に向上させるために、これらの2つの変換器の注意融合を導入する。
論文 参考訳(メタデータ) (2024-05-02T08:49:01Z) - Dynamic Kernel-Based Adaptive Spatial Aggregation for Learned Image
Compression [63.56922682378755]
本稿では,空間アグリゲーション機能の拡張に焦点をあて,動的カーネルベースの変換符号化を提案する。
提案したアダプティブアグリゲーションはカーネルオフセットを生成し、コンテント条件付き範囲の有効な情報をキャプチャして変換を支援する。
実験により,本手法は,最先端の学習手法と比較して,3つのベンチマークにおいて高い速度歪み性能が得られることを示した。
論文 参考訳(メタデータ) (2023-08-17T01:34:51Z) - ESSAformer: Efficient Transformer for Hyperspectral Image
Super-resolution [76.7408734079706]
単一ハイパースペクトル像超解像(単一HSI-SR)は、低分解能観測から高分解能ハイパースペクトル像を復元することを目的としている。
本稿では,1つのHSI-SRの繰り返し精製構造を持つESSA注目組込みトランスフォーマネットワークであるESSAformerを提案する。
論文 参考訳(メタデータ) (2023-07-26T07:45:14Z) - A Nested Matrix-Tensor Model for Noisy Multi-view Clustering [5.132856740094742]
次数3のスパイクされたランク1テンソルモデルを拡張するネスト行列テンソルモデルを提案する。
理論的結果から,提案手法の正確な精度を予測できることが示唆された。
本分析では, モデルパラメータによって, 予期せぬ非自明な相転移現象を呈する。
論文 参考訳(メタデータ) (2023-05-31T16:13:46Z) - Deep Diversity-Enhanced Feature Representation of Hyperspectral Images [87.47202258194719]
トポロジを改良して3次元畳み込みを補正し,上行階の高次化を図る。
また、要素間の独立性を最大化するために特徴マップに作用する新しい多様性対応正規化(DA-Reg)項を提案する。
提案したRe$3$-ConvSetとDA-Regの優位性を実証するために,様々なHS画像処理および解析タスクに適用する。
論文 参考訳(メタデータ) (2023-01-15T16:19:18Z) - Data-heterogeneity-aware Mixing for Decentralized Learning [63.83913592085953]
グラフの混合重みとノード間のデータ不均一性の関係に収束の依存性を特徴付ける。
グラフが現在の勾配を混合する能力を定量化する計量法を提案する。
そこで本研究では,パラメータを周期的かつ効率的に最適化する手法を提案する。
論文 参考訳(メタデータ) (2022-04-13T15:54:35Z) - A Model for Multi-View Residual Covariances based on Perspective
Deformation [88.21738020902411]
マルチビューSfM, オードメトリ, SLAMセットアップにおける視覚的残差の共分散モデルの導出を行う。
我々は、合成データと実データを用いてモデルを検証し、それを光度および特徴量に基づくバンドル調整に統合する。
論文 参考訳(メタデータ) (2022-02-01T21:21:56Z) - Multi-View Spectral Clustering Tailored Tensor Low-Rank Representation [105.33409035876691]
本稿では,テンソル低ランクモデルに基づくマルチビュースペクトルクラスタリング(MVSC)の問題について検討する。
MVSCに適合する新しい構造テンソル低ランクノルムを設計する。
提案手法は最先端の手法よりもかなり優れていることを示す。
論文 参考訳(メタデータ) (2020-04-30T11:52:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。