論文の概要: When Segmentation Meets Hyperspectral Image: New Paradigm for Hyperspectral Image Classification
- arxiv url: http://arxiv.org/abs/2502.12541v1
- Date: Tue, 18 Feb 2025 05:04:29 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-19 14:07:08.605698
- Title: When Segmentation Meets Hyperspectral Image: New Paradigm for Hyperspectral Image Classification
- Title(参考訳): ハイパースペクトル画像とセグメンテーション:ハイパースペクトル画像分類のための新しいパラダイム
- Authors: Weilian Zhou, Weixuan Xie, Sei-ichiro Kamata, Man Sing Wong, Huiying, Hou, Haipeng Wang,
- Abstract要約: ハイパースペクトル画像(HSI)分類は、リモートセンシングの基盤であり、豊富なスペクトル情報を通じて正確な材料と土地被覆の識別を可能にする。
ディープラーニングはこのタスクに大きな進歩をもたらしたが、小さなパッチベースの分類器は進歩の90%以上を占めており、制限に直面している。
本研究では, HSI分類のための新しいパラダイムとベースラインであるHSIsegを提案し, これらの課題を克服するために, 分割手法と新しい動的シフト地域変換器(DSRT)を組み合わせる。
- 参考スコア(独自算出の注目度): 4.179738334055251
- License:
- Abstract: Hyperspectral image (HSI) classification is a cornerstone of remote sensing, enabling precise material and land-cover identification through rich spectral information. While deep learning has driven significant progress in this task, small patch-based classifiers, which account for over 90% of the progress, face limitations: (1) the small patch (e.g., 7x7, 9x9)-based sampling approach considers a limited receptive field, resulting in insufficient spatial structural information critical for object-level identification and noise-like misclassifications even within uniform regions; (2) undefined optimal patch sizes lead to coarse label predictions, which degrade performance; and (3) a lack of multi-shape awareness around objects. To address these challenges, we draw inspiration from large-scale image segmentation techniques, which excel at handling object boundaries-a capability essential for semantic labeling in HSI classification. However, their application remains under-explored in this task due to (1) the prevailing notion that larger patch sizes degrade performance, (2) the extensive unlabeled regions in HSI groundtruth, and (3) the misalignment of input shapes between HSI data and segmentation models. Thus, in this study, we propose a novel paradigm and baseline, HSIseg, for HSI classification that leverages segmentation techniques combined with a novel Dynamic Shifted Regional Transformer (DSRT) to overcome these challenges. We also introduce an intuitive progressive learning framework with adaptive pseudo-labeling to iteratively incorporate unlabeled regions into the training process, thereby advancing the application of segmentation techniques. Additionally, we incorporate auxiliary data through multi-source data collaboration, promoting better feature interaction. Validated on five public HSI datasets, our proposal outperforms state-of-the-art methods.
- Abstract(参考訳): ハイパースペクトル画像(HSI)分類は、リモートセンシングの基盤であり、豊富なスペクトル情報を通じて正確な材料と土地被覆の識別を可能にする。
ディープラーニングは、このタスクにおいて大きな進歩をもたらしたが、小さなパッチベースの分類器は、進歩の90%以上を占めるが、(1)小さなパッチ(例:7x7,9x9)ベースのサンプリング手法は、限定的な受容領域を考慮し、結果として、一様領域内においてもオブジェクトレベルの識別やノイズのような誤分類に重要な空間的構造情報が不足する、(2)未定義の最適パッチサイズが粗いラベル予測につながり、パフォーマンスが低下する、(3)オブジェクトのマルチシェイプ認識が欠如する、といった制約がある。
これらの課題に対処するため,HSI分類におけるセマンティックラベリングに不可欠なオブジェクト境界処理能力である大規模画像分割技術から着想を得た。
しかし,(1)より大きなパッチサイズが性能を低下させるという一般的な考え方,(2)HSIの広い未ラベル領域,(3)HSIデータとセグメンテーションモデル間の入力形状の不整合などにより,その応用はいまだ検討されていない。
そこで本研究では,HSI分類のための新しいパラダイムとベースラインであるHSIsegを提案し,これらの課題を克服するために,分割手法と新しい動的シフト地域変換器(DSRT)を組み合わせる。
また,適応的な擬似ラベルを用いた直感的な学習フレームワークを導入し,未ラベル領域をトレーニングプロセスに反復的に組み込むことにより,セグメンテーション手法の適用を推し進める。
さらに、マルチソースデータコラボレーションを通じて補助データを導入し、より良い機能相互作用を促進する。
5つの公開HSIデータセットで検証され、我々の提案は最先端の手法より優れている。
関連論文リスト
- Unsupervised Domain Adaptation with Dynamic Clustering and Contrastive Refinement for Gait Recognition [3.856206634777065]
歩行認識は、個人の歩行パターンを分析することによって、遠くにいる個人を識別する新興技術である。
近年,クラスタリングに基づく教師なし領域適応手法を用いて,教師なし歩行認識について検討している。
本稿では,クラスタリングとモデルトレーニングにおけるノイズの多い擬似ラベルの影響を低減することを目的とした,GaitD CCRと呼ばれる新しいモデルを提案する。
論文 参考訳(メタデータ) (2025-01-28T00:55:07Z) - Frequency-based Matcher for Long-tailed Semantic Segmentation [22.199174076366003]
我々は、比較的未探索なタスク設定、長い尾のセマンティックセマンティックセグメンテーション(LTSS)に焦点を当てる。
本稿では,セマンティックセグメンテーション手法と長鎖解の性能を示すために,二値評価システムを提案し,LTSSベンチマークを構築した。
また,1対1のマッチングによって過剰な圧縮問題を解決する周波数ベースのマーカであるLTSSを改善するトランスフォーマーベースのアルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-06-06T09:57:56Z) - Auxiliary Tasks Enhanced Dual-affinity Learning for Weakly Supervised
Semantic Segmentation [79.05949524349005]
AuxSegNet+は、サリエンシマップから豊富な情報を探索する弱教師付き補助学習フレームワークである。
また,サリエンシとセグメンテーションの特徴マップから画素レベルの親和性を学習するためのクロスタスク親和性学習機構を提案する。
論文 参考訳(メタデータ) (2024-03-02T10:03:21Z) - Improving Anomaly Segmentation with Multi-Granularity Cross-Domain
Alignment [17.086123737443714]
異常セグメンテーションは、画像中の非定型物体を識別する上で重要な役割を担っている。
既存の手法は合成データに顕著な結果を示すが、合成データドメインと実世界のデータドメインの相違を考慮できないことが多い。
シーンと個々のサンプルレベルの両方で、ドメイン間の機能を調和させるのに適した、マルチグラニュラリティ・クロスドメインアライメントフレームワークを導入します。
論文 参考訳(メタデータ) (2023-08-16T22:54:49Z) - Deep face recognition with clustering based domain adaptation [57.29464116557734]
そこで本研究では,ターゲットドメインとソースがクラスを共有しない顔認識タスクを対象とした,クラスタリングに基づく新しいドメイン適応手法を提案する。
本手法は,特徴領域をグローバルに整列させ,その一方で,対象クラスタを局所的に識別することで,識別対象特徴を効果的に学習する。
論文 参考訳(メタデータ) (2022-05-27T12:29:11Z) - GAF-NAU: Gramian Angular Field encoded Neighborhood Attention U-Net for
Pixel-Wise Hyperspectral Image Classification [0.0]
我々は,ピクセルベースのHSI分類のための新しいディープラーニングアーキテクチャ,すなわちGramian Angular Field Encoded Neighborhood Attention U-Net(GAF-NAU)を提案する。
提案手法は,2D-CNNに基づく分類を行うために,対象画素を中心にした領域やパッチを必要としない。
公開されている3つのHSIデータセットの評価結果から,提案モデルの有効性が示された。
論文 参考訳(メタデータ) (2022-04-21T13:45:18Z) - AF$_2$: Adaptive Focus Framework for Aerial Imagery Segmentation [86.44683367028914]
航空画像のセグメンテーションにはいくつかの独特な課題があり、中でも最も重要なものは前景と背景のアンバランスにある。
本稿では,階層的なセグメンテーション手法を採用し,マルチスケール表現を適応的に活用するAdaptive Focus Framework (AF$)を提案する。
AF$は、広く使われている3つの航空ベンチマークの精度を大幅に改善した。
論文 参考訳(メタデータ) (2022-02-18T10:14:45Z) - Semi-supervised Domain Adaptive Structure Learning [72.01544419893628]
半教師付きドメイン適応 (SSDA) は,1) アノテーションの低いデータに過度に適合する手法と,2) ドメイン間の分散シフトの両方を克服しなければならない課題である。
SSLとDAの協調を正規化するための適応型構造学習手法を提案する。
論文 参考訳(メタデータ) (2021-12-12T06:11:16Z) - Improving Semi-Supervised and Domain-Adaptive Semantic Segmentation with
Self-Supervised Depth Estimation [94.16816278191477]
本稿では,セミアダプティブなセマンティックセマンティックセマンティックセグメンテーションのためのフレームワークを提案する。
ラベルのない画像シーケンスでのみ訓練された自己教師付き単眼深度推定によって強化される。
提案したモデルをCityscapesデータセット上で検証する。
論文 参考訳(メタデータ) (2021-08-28T01:33:38Z) - Leveraging Auxiliary Tasks with Affinity Learning for Weakly Supervised
Semantic Segmentation [88.49669148290306]
そこで我々はAuxSegNetと呼ばれる弱教師付きマルチタスク・フレームワークを提案し,サリエンシ検出とマルチラベル画像分類を補助タスクとして活用する。
同様の構造的セマンティクスに着想を得て,サリエンシとセグメンテーションの表現から,クロスタスクなグローバル画素レベルの親和性マップを学習することを提案する。
学習されたクロスタスク親和性は、両方のタスクに対して改善された擬似ラベルを提供するために、唾液度予測を洗練し、CAMマップを伝播するために使用することができる。
論文 参考訳(メタデータ) (2021-07-25T11:39:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。