論文の概要: HyperspectralMAE: The Hyperspectral Imagery Classification Model using Fourier-Encoded Dual-Branch Masked Autoencoder
- arxiv url: http://arxiv.org/abs/2505.05710v1
- Date: Fri, 09 May 2025 01:16:42 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-12 20:40:10.116957
- Title: HyperspectralMAE: The Hyperspectral Imagery Classification Model using Fourier-Encoded Dual-Branch Masked Autoencoder
- Title(参考訳): HyperspectralMAE:Fourier-Encoded Dual-Branch Masked Autoencoderを用いたハイパースペクトル画像分類モデル
- Authors: Wooyoung Jeong, Hyun Jae Park, Seonghun Jeong, Jong Wook Jang, Tae Hoon Lim, Dae Seoung Kim,
- Abstract要約: ハイパースペクトル画像は、豊富なスペクトルの詳細を提供するが、空間領域とスペクトル領域の両方において、その高次元性のためにユニークな課題を提起する。
テキストマスキング戦略を用いたハイパースペクトルデータのためのトランスフォーマーベースモデルであるtextitHyperspectralMAE を提案する。
ハイパースペクトルMAEは、二重次元事前学習が頑健なスペクトル空間表現をもたらすことを確認し、インドパインズの最先端の伝達学習精度を達成する。
- 参考スコア(独自算出の注目度): 0.04332259966721321
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Hyperspectral imagery provides rich spectral detail but poses unique challenges because of its high dimensionality in both spatial and spectral domains. We propose \textit{HyperspectralMAE}, a Transformer-based foundation model for hyperspectral data that employs a \textit{dual masking} strategy: during pre-training we randomly occlude 50\% of spatial patches and 50\% of spectral bands. This forces the model to learn representations capable of reconstructing missing information across both dimensions. To encode spectral order, we introduce learnable harmonic Fourier positional embeddings based on wavelength. The reconstruction objective combines mean-squared error (MSE) with the spectral angle mapper (SAM) to balance pixel-level accuracy and spectral-shape fidelity. The resulting model contains about $1.8\times10^{8}$ parameters and produces 768-dimensional embeddings, giving it sufficient capacity for transfer learning. We pre-trained HyperspectralMAE on two large hyperspectral corpora -- NASA EO-1 Hyperion ($\sim$1\,600 scenes, $\sim$$3\times10^{11}$ pixel spectra) and DLR EnMAP Level-0 ($\sim$1\,300 scenes, $\sim$$3\times10^{11}$ pixel spectra) -- and fine-tuned it for land-cover classification on the Indian Pines benchmark. HyperspectralMAE achieves state-of-the-art transfer-learning accuracy on Indian Pines, confirming that masked dual-dimensional pre-training yields robust spectral-spatial representations. These results demonstrate that dual masking and wavelength-aware embeddings advance hyperspectral image reconstruction and downstream analysis.
- Abstract(参考訳): ハイパースペクトル画像は、豊富なスペクトルの詳細を提供するが、空間領域とスペクトル領域の両方において、その高次元性のためにユニークな課題を提起する。
本稿では,ハイパースペクトルデータのための変換器ベース基盤モデルである \textit{HyperspectralMAE} を提案する。
これにより、モデルは両方の次元にまたがって行方不明の情報を再構築できる表現を学習せざるを得ない。
スペクトル秩序を符号化するために、波長に基づく学習可能な高調波フーリエ位置埋め込みを導入する。
再構成の目的は、平均二乗誤差(MSE)とスペクトル角マッパー(SAM)を組み合わせることで、画素レベルの精度とスペクトル形状の忠実さのバランスをとることである。
得られたモデルは約1.8\times10^{8}$パラメータを含み、768次元の埋め込みを生成し、転送学習に十分な能力を与える。
私たちはHyperspectralMAEを2つの大きなハイパースペクトルコーパス(NASA EO-1 Hyperion$\sim$1\,600 scene, $\sim$3\times10^{11}$ pixel spectra)とDLR EnMAP Level-0$\sim$1\,300 scene, $\sim$3\times10^{11}$ pixel spectra)で事前訓練し、インディアンパインズベンチマークの土地被覆分類のために微調整した。
ハイパースペクトルMAEは、二重次元事前学習が頑健なスペクトル空間表現をもたらすことを確認し、インドパインズの最先端の伝達学習精度を達成する。
これらの結果は、双対マスキングと波長認識の埋め込みにより、高スペクトル像の再構成と下流解析が進行することを示す。
関連論文リスト
- CARL: Camera-Agnostic Representation Learning for Spectral Image Analysis [75.25966323298003]
スペクトルイメージングは、医療や都市景観の理解など、様々な領域で有望な応用を提供する。
スペクトルカメラのチャネル次元と捕獲波長のばらつきは、AI駆動方式の開発を妨げる。
我々は、$textbfC$amera-$textbfA$gnostic $textbfR$esupervised $textbfL$のモデルである$textbfCARL$を紹介した。
論文 参考訳(メタデータ) (2025-04-27T13:06:40Z) - S$^2$Mamba: A Spatial-spectral State Space Model for Hyperspectral Image Classification [44.99672241508994]
ハイパースペクトル画像(HSI)を用いた土地被覆解析は、空間分解能の低さと複雑なスペクトル情報のため、未解決の課題である。
ハイパースペクトル画像分類のための空間スペクトル状態空間モデルであるS$2$Mambaを提案する。
論文 参考訳(メタデータ) (2024-04-28T15:12:56Z) - SpectralGPT: Spectral Remote Sensing Foundation Model [60.023956954916414]
SpectralGPTという名前のユニバーサルRS基盤モデルは、新しい3D生成事前学習変換器(GPT)を用いてスペクトルRS画像を処理するために構築されている。
既存の基礎モデルと比較して、SpectralGPTは、様々なサイズ、解像度、時系列、領域をプログレッシブトレーニング形式で対応し、広範なRSビッグデータのフル活用を可能にする。
我々の評価では、事前訓練されたスペクトルGPTモデルによる顕著な性能向上が強調され、地球科学分野におけるスペクトルRSビッグデータ応用の進展に有意な可能性を示唆している。
論文 参考訳(メタデータ) (2023-11-13T07:09:30Z) - Neural Spectro-polarimetric Fields [23.54056495576914]
我々は, 位置, 方向, 波長の連続変数で, 物理的に有意なストークスベクトルをモデル化したニューラル・スペクトロ偏光場(NeSpoF)を提案する。
NeSpoFは本質的にノイズの多い生計測を管理し、メモリ効率を示し、物理的に重要な信号を保存する。
本稿では,合成シーンと実世界のシーンの両方からなる,最初の多視点ハイパースペクトル偏光画像データセットを提案する。
論文 参考訳(メタデータ) (2023-06-21T21:00:46Z) - Object Detection in Hyperspectral Image via Unified Spectral-Spatial
Feature Aggregation [55.9217962930169]
S2ADetは、高スペクトル画像に固有の豊富なスペクトル情報と空間補完情報を利用する物体検出器である。
S2ADetは既存の最先端メソッドを超え、堅牢で信頼性の高い結果を達成する。
論文 参考訳(メタデータ) (2023-06-14T09:01:50Z) - S^2-Transformer for Mask-Aware Hyperspectral Image Reconstruction [59.39343894089959]
トランスフォーマー再構成バックエンドを備えたスナップショット圧縮撮像器(CASSI)は、高忠実度センシング性能を示す。
空間的およびスペクトル的アテンションデザインは ハイパースペクトルモデリングの限界を示します
パラレルアテンション設計とマスク認識学習戦略により実装された空間スペクトル(S2-)変換器を提案する。
論文 参考訳(メタデータ) (2022-09-24T19:26:46Z) - A 3-stage Spectral-spatial Method for Hyperspectral Image Classification [2.28438857884398]
ハイパースペクトル画像中の画素の分類に空間情報とスペクトル情報の両方を利用する新しいフレームワークを提案する。
6つのベンチマークハイパースペクトルデータセット上での3つの最先端アルゴリズムに対する本手法の優位性を示す。
論文 参考訳(メタデータ) (2022-04-20T08:23:05Z) - Mask-guided Spectral-wise Transformer for Efficient Hyperspectral Image
Reconstruction [127.20208645280438]
ハイパースペクトル画像(HSI)再構成は、2次元計測から3次元空間スペクトル信号を復元することを目的としている。
スペクトル間相互作用のモデル化は、HSI再構成に有用である。
Mask-guided Spectral-wise Transformer (MST) は,HSI再構成のための新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2021-11-15T16:59:48Z) - Learning Spatial-Spectral Prior for Super-Resolution of Hyperspectral
Imagery [79.69449412334188]
本稿では,最先端の残差学習をベースとした単一グレー/RGB画像の超解像化手法について検討する。
本稿では,空間情報とハイパースペクトルデータのスペクトル間の相関をフル活用するための空間スペクトル先行ネットワーク(SSPN)を提案する。
実験結果から,SSPSR法により高分解能高分解能高分解能画像の詳細が得られた。
論文 参考訳(メタデータ) (2020-05-18T14:25:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。