論文の概要: Locality-Aware Hyperspectral Classification
- arxiv url: http://arxiv.org/abs/2309.01561v1
- Date: Mon, 4 Sep 2023 12:29:32 GMT
- ステータス: 処理完了
- システム内更新日: 2023-09-06 18:41:22.065752
- Title: Locality-Aware Hyperspectral Classification
- Title(参考訳): 局所性を考慮したハイパースペクトル分類
- Authors: Fangqin Zhou, Mert Kilickaya, Joaquin Vanschoren
- Abstract要約: 本稿では,局所情報とスペクトル情報の両方をモデル化した視覚変換器であるHyperspectral Locality-aware Image TransformEr(HyLITE)を紹介する。
提案手法は, 競合するベースラインを高いマージンで上回り, 最大10%の精度向上を実現している。
- 参考スコア(独自算出の注目度): 8.737375836744933
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Hyperspectral image classification is gaining popularity for high-precision
vision tasks in remote sensing, thanks to their ability to capture visual
information available in a wide continuum of spectra. Researchers have been
working on automating Hyperspectral image classification, with recent efforts
leveraging Vision-Transformers. However, most research models only spectra
information and lacks attention to the locality (i.e., neighboring pixels),
which may be not sufficiently discriminative, resulting in performance
limitations. To address this, we present three contributions: i) We introduce
the Hyperspectral Locality-aware Image TransformEr (HyLITE), a vision
transformer that models both local and spectral information, ii) A novel
regularization function that promotes the integration of local-to-global
information, and iii) Our proposed approach outperforms competing baselines by
a significant margin, achieving up to 10% gains in accuracy. The trained models
and the code are available at HyLITE.
- Abstract(参考訳): 超スペクトル画像分類は、広範囲のスペクトルで利用可能な視覚情報をキャプチャする能力のおかげで、リモートセンシングにおける高精度な視覚タスクで人気が高まっている。
ハイパースペクトル画像分類の自動化に研究者が取り組んでおり、ビジョン・トランスフォーマーを活用している。
しかし、ほとんどの研究モデルでは、スペクトル情報のみを扱っており、局所性(すなわち隣接するピクセル)に注意が払われていない。
これに対処するために、私たちは3つの貢献をします。
i) 局所情報とスペクトル情報の両方をモデル化する視覚トランスであるハイライト(hyperspectral locality-aware image transformer)について紹介する。
二 地域・地域情報の統合を促進する新たな正規化機能及び
三 提案手法は、競合ベースラインをかなりのマージンで上回り、精度を最大10%向上させる。
トレーニングされたモデルとコードはHyLITEで利用可能だ。
関連論文リスト
- SpectralGPT: Spectral Remote Sensing Foundation Model [60.023956954916414]
SpectralGPTという名前のユニバーサルRS基盤モデルは、新しい3D生成事前学習変換器(GPT)を用いてスペクトルRS画像を処理するために構築されている。
既存の基礎モデルと比較して、SpectralGPTは、様々なサイズ、解像度、時系列、領域をプログレッシブトレーニング形式で対応し、広範なRSビッグデータのフル活用を可能にする。
我々の評価では、事前訓練されたスペクトルGPTモデルによる顕著な性能向上が強調され、地球科学分野におけるスペクトルRSビッグデータ応用の進展に有意な可能性を示唆している。
論文 参考訳(メタデータ) (2023-11-13T07:09:30Z) - DiffSpectralNet : Unveiling the Potential of Diffusion Models for
Hyperspectral Image Classification [6.521187080027966]
我々は拡散と変圧器技術を組み合わせたDiffSpectralNetと呼ばれる新しいネットワークを提案する。
まず,拡散モデルに基づく教師なし学習フレームワークを用いて,高レベル・低レベルのスペクトル空間的特徴を抽出する。
この拡散法はスペクトル空間の特徴を多様かつ有意義に抽出し,HSI分類の改善につながる。
論文 参考訳(メタデータ) (2023-10-29T15:26:37Z) - Bilevel Generative Learning for Low-Light Vision [64.77933848939327]
本稿では、RAWからRGB領域へのデータ変換のための生成ブロックを導入することで、汎用的な低照度ビジョンソリューションを提案する。
この新しいアプローチは、フィールドにおける最初のデータ生成を明示的に表現することで、多様な視覚問題を結合する。
そこで我々は,新しい二段階生成学習パラダイムを取得するために,低コストと高精度の異なる目標を目標とする2種類の学習戦略を開発した。
論文 参考訳(メタデータ) (2023-08-07T07:59:56Z) - DCN-T: Dual Context Network with Transformer for Hyperspectral Image
Classification [109.09061514799413]
複雑な撮像条件による空間変動のため,HSI分類は困難である。
本稿では,HSIを高品質な三スペクトル画像に変換する三スペクトル画像生成パイプラインを提案する。
提案手法は,HSI分類における最先端手法よりも優れている。
論文 参考訳(メタデータ) (2023-04-19T18:32:52Z) - Implicit and Explicit Attention for Zero-Shot Learning [11.66422653137002]
ゼロショット学習(ZSL)モデルにおけるバイアス問題に対処するための暗黙的かつ明示的な注意機構を提案する。
我々は、AWA2、CUB、SUNの3つの人気のあるベンチマークで包括的な実験を行う。
論文 参考訳(メタデータ) (2021-10-02T18:06:21Z) - RAMS-Trans: Recurrent Attention Multi-scale Transformer forFine-grained
Image Recognition [26.090419694326823]
地域注意の局所化と増幅は重要な要素であり、畳み込みニューラルネットワーク(CNN)ベースのアプローチによって多くの研究がなされている。
本稿では,変圧器の自己注意を用いて識別領域の注意を学習する,繰り返し注意型マルチスケール変圧器(RAMS-Trans)を提案する。
論文 参考訳(メタデータ) (2021-07-17T06:22:20Z) - Exploring Vision Transformers for Fine-grained Classification [0.0]
アーキテクチャ変更を必要とせずに情報領域をローカライズする,きめ細かな画像分類タスクのための多段階ViTフレームワークを提案する。
CUB-200-2011,Stanford Cars,Stanford Dogs,FGVC7 Plant Pathologyの4つのベンチマークを用いて,本手法の有効性を実証した。
論文 参考訳(メタデータ) (2021-06-19T23:57:31Z) - Refiner: Refining Self-attention for Vision Transformers [85.80887884154427]
視覚変換器(ViT)は、CNNと比較して画像分類タスクにおいて、競合する精度を示す。
本稿では,ViTの自己注意マップを直接洗練するために,ファインダと呼ばれる概念的にシンプルなスキームを導入する。
refinerはアテンションマップの局所的なパターンを拡大するために畳み込みを適用します。これは、ローカルなアテンション特徴を学習可能なカーネルで局所的に集約した上で、グローバルなアテンションで集約した分散ローカルアテンション特徴と等価であることを示す。
論文 参考訳(メタデータ) (2021-06-07T15:24:54Z) - Adversarial Feature Augmentation and Normalization for Visual
Recognition [109.6834687220478]
最近のコンピュータビジョンの進歩は、分類モデルの一般化能力を改善するために、逆データ拡張を利用する。
本稿では,中間的特徴埋め込みにおける敵対的拡張を提唱する効率的かつ効率的な代替手法を提案する。
代表的なバックボーンネットワークを用いて,多様な視覚認識タスクにまたがる提案手法を検証する。
論文 参考訳(メタデータ) (2021-03-22T20:36:34Z) - Spatial-Spectral Residual Network for Hyperspectral Image
Super-Resolution [82.1739023587565]
ハイパースペクトル画像超解像のための新しいスペクトル空間残差ネットワーク(SSRNet)を提案する。
提案手法は,2次元畳み込みではなく3次元畳み込みを用いて空間スペクトル情報の探索を効果的に行うことができる。
各ユニットでは空間的・時間的分離可能な3次元畳み込みを用いて空間的・スペクトル的な情報を抽出する。
論文 参考訳(メタデータ) (2020-01-14T03:34:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。