論文の概要: A Comprehensive Survey for Hyperspectral Image Classification: The Evolution from Conventional to Transformers
- arxiv url: http://arxiv.org/abs/2404.14955v3
- Date: Wed, 12 Jun 2024 06:21:59 GMT
- ステータス: 処理完了
- システム内更新日: 2024-06-13 22:24:31.755132
- Title: A Comprehensive Survey for Hyperspectral Image Classification: The Evolution from Conventional to Transformers
- Title(参考訳): ハイパースペクトル画像分類に関する包括的調査 : 従来型から変圧器への進化
- Authors: Muhammad Ahmad, Salvatore Distifano, Adil Mehmood Khan, Manuel Mazzara, Chenyu Li, Jing Yao, Hao Li, Jagannath Aryal, Gemine Vivone, Danfeng Hong,
- Abstract要約: ハイパースペクトル画像分類(HSC)は、HSデータの高次元性と複雑な性質のために難しい課題である。
従来の機械学習は効率的でありながら、最適な特徴セット、人間駆動設計における主観性、バイアス、制限によって、現実世界のデータに課題に直面している。
近年,これらの課題に対処するための強力なツールとしてDL技術が登場している。
- 参考スコア(独自算出の注目度): 25.46596944661226
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Hyperspectral Image Classification (HSC) is a challenging task due to the high dimensionality and complex nature of Hyperspectral (HS) data. Traditional Machine Learning approaches while effective, face challenges in real-world data due to varying optimal feature sets, subjectivity in human-driven design, biases, and limitations. Traditional approaches encounter the curse of dimensionality, struggle with feature selection and extraction, lack spatial information consideration, exhibit limited robustness to noise, face scalability issues, and may not adapt well to complex data distributions. In recent years, DL techniques have emerged as powerful tools for addressing these challenges. This survey provides a comprehensive overview of the current trends and future prospects in HSC, focusing on the advancements from DL models to the emerging use of Transformers. We review the key concepts, methodologies, and state-of-the-art approaches in DL for HSC. We explore the potential of Transformer-based models in HSC, outlining their benefits and challenges. We also delve into emerging trends in HSC, as well as thorough discussions on Explainable AI and Interoperability concepts along with Diffusion Models (image denoising, feature extraction, and image fusion). Additionally, we address several open challenges and research questions pertinent to HSC. Comprehensive experimental results have been undertaken using three HS datasets to verify the efficacy of various conventional DL models and Transformers. Finally, we outline future research directions and potential applications that can further enhance the accuracy and efficiency of HSC. The Source code is available at \url{https://github.com/mahmad00/Conventional-to-Transformer-for-Hyperspectral-Image-Classification-Surve y-2024}.
- Abstract(参考訳): ハイパースペクトル画像分類(HSC)は、ハイパースペクトル(HS)データの高次元性と複雑な性質のために難しい課題である。
従来の機械学習は効率的でありながら、最適な特徴セット、人間駆動設計における主観性、バイアス、制限によって、現実世界のデータに課題に直面している。
従来のアプローチでは、次元の呪い、特徴の選択と抽出の苦労、空間情報の考慮の欠如、ノイズに対するロバスト性、スケーラビリティの問題、複雑なデータ分布にうまく適応できない可能性がある。
近年,これらの課題に対処するための強力なツールとしてDL技術が登場している。
この調査は、DLモデルからトランスフォーマーの新たな利用への進歩に焦点を当て、HSCの現在の動向と今後の展望を概観するものである。
本稿では,HSC 用 DL における重要な概念,方法論,最先端のアプローチについて概説する。
HSCにおけるTransformerベースのモデルの可能性を探り、そのメリットと課題を概説する。
HSCの新たなトレンドや、説明可能なAIとインターオペラビリティの概念に関する徹底的な議論、拡散モデル(画像のデノゲーション、特徴抽出、イメージ融合)についても検討しています。
さらに,HSCに関連するいくつかのオープンな課題と研究課題に対処する。
3つのHSデータセットを用いて,従来のDLモデルとトランスフォーマーの有効性を検証した。
最後に,HSCの精度と効率をさらに向上させる研究の方向性と応用の可能性について概説する。
ソースコードは \url{https://github.com/mahmad00/Conventional-to-Transformer-for-Hyperspectral- Image-Classification-Survey-2024} で公開されている。
関連論文リスト
- Hybrid State-Space and GRU-based Graph Tokenization Mamba for Hyperspectral Image Classification [14.250184447492208]
ハイパースペクトル画像(HSI)分類は, 環境モニタリング, 農業, 都市計画などの領域において重要な役割を担っている。
機械学習や畳み込みニューラルネットワーク(CNN)といった従来の手法は、複雑なスペクトル空間の特徴を効果的に捉えるのに苦労することが多い。
この研究は、スペクトル空間トークン生成、グラフベースのトークン優先順位付け、およびクロスアテンション機構を組み合わせたハイブリッドモデルであるGraphMambaを提案する。
論文 参考訳(メタデータ) (2025-02-10T13:02:19Z) - Collaborative Imputation of Urban Time Series through Cross-city Meta-learning [54.438991949772145]
メタ学習型暗黙的ニューラル表現(INR)を利用した新しい協調的計算パラダイムを提案する。
次に,モデルに依存しないメタ学習による都市間協調学習手法を提案する。
20のグローバル都市から得られた多様な都市データセットの実験は、我々のモデルの優れた計算性能と一般化可能性を示している。
論文 参考訳(メタデータ) (2025-01-20T07:12:40Z) - Time Series Viewmakers for Robust Disruption Prediction [0.0]
本稿では,新たな時系列ビューメーカネットワークを用いて,トレーニングデータの多種多様な拡張や“ビュー”を生成する方法について検討する。
以上の結果から,AUC と F2 の得点は,AUC と F2 のスコアが標準的あるいは非拡張よりも向上していることがわかった。
論文 参考訳(メタデータ) (2024-10-14T20:23:43Z) - HRVMamba: High-Resolution Visual State Space Model for Dense Prediction [60.80423207808076]
効率的なハードウェアを意識した設計のステートスペースモデル(SSM)は、コンピュータビジョンタスクにおいて大きな可能性を証明している。
これらのモデルは、誘導バイアスの不足、長距離の忘れ、低解像度の出力表現の3つの主要な課題によって制約されている。
本稿では, 変形可能な畳み込みを利用して, 長距離忘れ問題を緩和する動的ビジュアル状態空間(DVSS)ブロックを提案する。
また,DVSSブロックに基づく高分解能視覚空間モデル(HRVMamba)を導入し,プロセス全体を通して高分解能表現を保存する。
論文 参考訳(メタデータ) (2024-10-04T06:19:29Z) - A Simple Background Augmentation Method for Object Detection with Diffusion Model [53.32935683257045]
コンピュータビジョンでは、データの多様性の欠如がモデル性能を損なうことはよく知られている。
本稿では, 生成モデルの進歩を生かして, 単純かつ効果的なデータ拡張手法を提案する。
背景強化は、特にモデルの堅牢性と一般化能力を大幅に改善する。
論文 参考訳(メタデータ) (2024-08-01T07:40:00Z) - From CNNs to Transformers in Multimodal Human Action Recognition: A Survey [23.674123304219822]
人間の行動認識はコンピュータビジョンにおいて最も広く研究されている研究問題の1つである。
近年の研究では、マルチモーダルデータを用いてこの問題に対処することで性能が向上することが示されている。
視覚モデリングにおけるトランスフォーマーの最近の増加は、アクション認識タスクのパラダイムシフトを引き起こしている。
論文 参考訳(メタデータ) (2024-05-22T02:11:18Z) - MMA-DFER: MultiModal Adaptation of unimodal models for Dynamic Facial Expression Recognition in-the-wild [81.32127423981426]
実世界のアプリケーションでは,音声およびビデオデータに基づくマルチモーダル感情認識が重要である。
近年の手法は、強力なマルチモーダルエンコーダの事前学習に自己教師付き学習(SSL)の進歩を活用することに重点を置いている。
SSL-pre-trained disimodal encoders を用いて,この問題に対する異なる視点とマルチモーダル DFER の性能向上について検討する。
論文 参考訳(メタデータ) (2024-04-13T13:39:26Z) - On the Challenges and Opportunities in Generative AI [135.2754367149689]
現在の大規模生成AIモデルは、ドメイン間で広く採用されるのを妨げるいくつかの基本的な問題に十分対応していない、と我々は主張する。
本研究は、現代の生成型AIパラダイムにおける重要な未解決課題を特定し、その能力、汎用性、信頼性をさらに向上するために取り組まなければならない。
論文 参考訳(メタデータ) (2024-02-28T15:19:33Z) - Comprehensive Exploration of Synthetic Data Generation: A Survey [4.485401662312072]
この研究は、過去10年間で417のSynthetic Data Generationモデルを調査します。
その結果、ニューラルネットワークベースのアプローチが普及し、モデルのパフォーマンスと複雑性が向上したことが明らかになった。
コンピュータビジョンが支配的であり、GANが主要な生成モデルであり、拡散モデル、トランスフォーマー、RNNが競合する。
論文 参考訳(メタデータ) (2024-01-04T20:23:51Z) - Interpretable Hyperspectral AI: When Non-Convex Modeling meets
Hyperspectral Remote Sensing [57.52865154829273]
ハイパースペクトルイメージング、別名画像分光法は、地球科学リモートセンシング(RS)におけるランドマーク技術です。
過去10年間で、主に熟練した専門家によってこれらのハイパースペクトル(HS)製品を分析するための取り組みが行われています。
このため、さまざまなHS RSアプリケーションのためのよりインテリジェントで自動的なアプローチを開発することが急務です。
論文 参考訳(メタデータ) (2021-03-02T03:32:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。