Fugu-MT 論文翻訳(概要): A Comprehensive Survey for Hyperspectral Image Classification: The Evolution from Conventional to Transformers and Mamba Models

論文の概要: A Comprehensive Survey for Hyperspectral Image Classification: The Evolution from Conventional to Transformers and Mamba Models

arxiv url: http://arxiv.org/abs/2404.14955v4
Date: Thu, 14 Nov 2024 07:37:28 GMT
ステータス: 翻訳完了
システム内更新日: 2024-11-28 17:07:32.017383
Title: A Comprehensive Survey for Hyperspectral Image Classification: The Evolution from Conventional to Transformers and Mamba Models
Title（参考訳）: ハイパースペクトル画像分類に関する包括的調査 : 従来型から変圧器・マンバモデルへの進化
Authors: Muhammad Ahmad, Salvatore Distifano, Adil Mehmood Khan, Manuel Mazzara, Chenyu Li, Hao Li, Jagannath Aryal, Yao Ding, Gemine Vivone, Danfeng Hong,
Abstract要約: ハイパースペクトル画像分類(HSC)は、HSデータの高次元性と複雑な性質のため、重要な課題を提示する。ディープラーニング(DL)技術は、これらの課題に対処するための堅牢なソリューションとして現れています。我々は,HSCのためのDLにおける重要な概念,方法論,および最先端のアプローチを体系的に検討した。
参考スコア（独自算出の注目度）: 25.18873183963132
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Hyperspectral Image Classification (HSC) presents significant challenges owing to the high dimensionality and intricate nature of Hyperspectral (HS) data. While traditional Machine Learning (TML) approaches have demonstrated effectiveness, they often encounter substantial obstacles in real-world applications, including the variability of optimal feature sets, subjectivity in human-driven design, inherent biases, and methodological limitations. Specifically, TML suffers from the curse of dimensionality, difficulties in feature selection and extraction, insufficient consideration of spatial information, limited robustness against noise, scalability issues, and inadequate adaptability to complex data distributions. In recent years, Deep Learning (DL) techniques have emerged as robust solutions to address these challenges. This survey offers a comprehensive overview of current trends and future prospects in HSC, emphasizing advancements from DL models to the increasing adoption of Transformer and Mamba Model architectures. We systematically review key concepts, methodologies, and state-of-the-art approaches in DL for HSC. Furthermore, we investigate the potential of Transformer-based models and the Mamba Model in HSC, detailing their advantages and challenges. Emerging trends in HSC are explored, including in-depth discussions on Explainable AI and Interoperability concepts, alongside Diffusion Models for image denoising, feature extraction, and image fusion. Comprehensive experimental results were conducted on three HS datasets to substantiate the efficacy of various conventional DL models and Transformers. Additionally, we identify several open challenges and pertinent research questions in the field of HSC. Finally, we outline future research directions and potential applications aimed at enhancing the accuracy and efficiency of HSC.
Abstract（参考訳）: ハイパースペクトル画像分類(HSC)は、ハイパースペクトル(HS)データの高次元性および複雑な性質のために重要な課題を提示する。従来の機械学習(TML)アプローチは有効性を示しているが、最適な特徴セットの可変性、人間駆動設計の主観性、固有のバイアス、方法論的な制限など、現実のアプリケーションではかなりの障害に遭遇することが多い。具体的には、TMLは、次元の呪い、特徴の選択と抽出の難しさ、空間情報の不十分な考慮、ノイズに対する頑健さの制限、スケーラビリティの問題、複雑なデータ分布への不適切な適応性に悩まされている。近年,これらの課題に対処する堅牢なソリューションとして,ディープラーニング(DL)技術が登場している。このサーベイは、DLモデルからTransformerとMamba Modelアーキテクチャの採用拡大への進歩を強調し、HSCの現在のトレンドと今後の展望を包括的に概説する。我々は,HSCのためのDLにおける重要な概念,方法論,および最先端のアプローチを体系的に検討した。さらに,HSCにおけるトランスフォーマーモデルとマンバモデルの可能性について検討し,その利点と課題を詳述する。 HSCの新たなトレンドとして、説明可能なAIとインターオペラビリティの概念に関する詳細な議論、画像の認識、特徴抽出、画像の融合に関する拡散モデルなどが紹介されている。 3つのHSデータセットを用いて,従来のDLモデルとトランスフォーマーの有効性を検証した。さらに,HSC分野におけるいくつかのオープン課題と関連する研究課題を明らかにした。最後に,HSCの精度と効率の向上を目的とした今後の研究の方向性と可能性について概説する。

関連論文リスト

Hybrid State-Space and GRU-based Graph Tokenization Mamba for Hyperspectral Image Classification [14.250184447492208]
ハイパースペクトル画像(HSI)分類は, 環境モニタリング, 農業, 都市計画などの領域において重要な役割を担っている。機械学習や畳み込みニューラルネットワーク(CNN)といった従来の手法は、複雑なスペクトル空間の特徴を効果的に捉えるのに苦労することが多い。この研究は、スペクトル空間トークン生成、グラフベースのトークン優先順位付け、およびクロスアテンション機構を組み合わせたハイブリッドモデルであるGraphMambaを提案する。
論文参考訳（メタデータ） (2025-02-10T13:02:19Z)
Collaborative Imputation of Urban Time Series through Cross-city Meta-learning [54.438991949772145]
メタ学習型暗黙的ニューラル表現(INR)を利用した新しい協調的計算パラダイムを提案する。次に,モデルに依存しないメタ学習による都市間協調学習手法を提案する。 20のグローバル都市から得られた多様な都市データセットの実験は、我々のモデルの優れた計算性能と一般化可能性を示している。
論文参考訳（メタデータ） (2025-01-20T07:12:40Z)
Time Series Viewmakers for Robust Disruption Prediction [0.0]
本稿では,新たな時系列ビューメーカネットワークを用いて,トレーニングデータの多種多様な拡張や“ビュー”を生成する方法について検討する。以上の結果から,AUC と F2 の得点は,AUC と F2 のスコアが標準的あるいは非拡張よりも向上していることがわかった。
論文参考訳（メタデータ） (2024-10-14T20:23:43Z)
HRVMamba: High-Resolution Visual State Space Model for Dense Prediction [60.80423207808076]
効率的なハードウェアを意識した設計のステートスペースモデル(SSM)は、コンピュータビジョンタスクにおいて大きな可能性を証明している。これらのモデルは、誘導バイアスの不足、長距離の忘れ、低解像度の出力表現の3つの主要な課題によって制約されている。本稿では, 変形可能な畳み込みを利用して, 長距離忘れ問題を緩和する動的ビジュアル状態空間(DVSS)ブロックを提案する。また,DVSSブロックに基づく高分解能視覚空間モデル(HRVMamba)を導入し,プロセス全体を通して高分解能表現を保存する。
論文参考訳（メタデータ） (2024-10-04T06:19:29Z)
A Simple Background Augmentation Method for Object Detection with Diffusion Model [53.32935683257045]
コンピュータビジョンでは、データの多様性の欠如がモデル性能を損なうことはよく知られている。本稿では, 生成モデルの進歩を生かして, 単純かつ効果的なデータ拡張手法を提案する。背景強化は、特にモデルの堅牢性と一般化能力を大幅に改善する。
論文参考訳（メタデータ） (2024-08-01T07:40:00Z)
From CNNs to Transformers in Multimodal Human Action Recognition: A Survey [23.674123304219822]
人間の行動認識はコンピュータビジョンにおいて最も広く研究されている研究問題の1つである。近年の研究では、マルチモーダルデータを用いてこの問題に対処することで性能が向上することが示されている。視覚モデリングにおけるトランスフォーマーの最近の増加は、アクション認識タスクのパラダイムシフトを引き起こしている。
論文参考訳（メタデータ） (2024-05-22T02:11:18Z)
MMA-DFER: MultiModal Adaptation of unimodal models for Dynamic Facial Expression Recognition in-the-wild [81.32127423981426]
実世界のアプリケーションでは,音声およびビデオデータに基づくマルチモーダル感情認識が重要である。近年の手法は、強力なマルチモーダルエンコーダの事前学習に自己教師付き学習(SSL)の進歩を活用することに重点を置いている。 SSL-pre-trained disimodal encoders を用いて,この問題に対する異なる視点とマルチモーダル DFER の性能向上について検討する。
論文参考訳（メタデータ） (2024-04-13T13:39:26Z)
On the Challenges and Opportunities in Generative AI [135.2754367149689]
現在の大規模生成AIモデルは、ドメイン間で広く採用されるのを妨げるいくつかの基本的な問題に十分対応していない、と我々は主張する。本研究は、現代の生成型AIパラダイムにおける重要な未解決課題を特定し、その能力、汎用性、信頼性をさらに向上するために取り組まなければならない。
論文参考訳（メタデータ） (2024-02-28T15:19:33Z)
Large Language Models for Forecasting and Anomaly Detection: A Systematic Literature Review [10.325003320290547]
本稿では,Large Language Models (LLMs) の予測・異常検出への応用について概説する。 LLMは、パターンを特定し、将来の事象を予測し、様々な領域にまたがる異常な振る舞いを検出するために、広範囲なデータセットを解析し分析する大きな可能性を示してきた。このレビューでは、膨大な歴史的データセットへの依存、さまざまな文脈における一般化可能性の問題、モデル幻覚の現象など、より広範な採用と有効性を阻害するいくつかの重要な課題を取り上げている。
論文参考訳（メタデータ） (2024-02-15T22:43:02Z)
Comprehensive Exploration of Synthetic Data Generation: A Survey [4.485401662312072]
この研究は、過去10年間で417のSynthetic Data Generationモデルを調査します。その結果、ニューラルネットワークベースのアプローチが普及し、モデルのパフォーマンスと複雑性が向上したことが明らかになった。コンピュータビジョンが支配的であり、GANが主要な生成モデルであり、拡散モデル、トランスフォーマー、RNNが競合する。
論文参考訳（メタデータ） (2024-01-04T20:23:51Z)
Differentiable Agent-based Epidemiology [71.81552021144589]
GradABM(GradABM)は、エージェントベースのモデリングのためのスケーラブルで微分可能な設計で、勾配に基づく学習と自動微分が可能である。 GradABMは、コモディティハードウェア上で数秒で数百万の人口をシミュレートし、ディープニューラルネットワークと統合し、異種データソースを取り込みます。
論文参考訳（メタデータ） (2022-07-20T07:32:02Z)
Interpretable Hyperspectral AI: When Non-Convex Modeling meets Hyperspectral Remote Sensing [57.52865154829273]
ハイパースペクトルイメージング、別名画像分光法は、地球科学リモートセンシング(RS)におけるランドマーク技術です。過去10年間で、主に熟練した専門家によってこれらのハイパースペクトル(HS)製品を分析するための取り組みが行われています。このため、さまざまなHS RSアプリケーションのためのよりインテリジェントで自動的なアプローチを開発することが急務です。
論文参考訳（メタデータ） (2021-03-02T03:32:10Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。