論文の概要: Multi-Scale U-Shape MLP for Hyperspectral Image Classification
- arxiv url: http://arxiv.org/abs/2307.10186v1
- Date: Wed, 5 Jul 2023 08:52:27 GMT
- ステータス: 処理完了
- システム内更新日: 2023-07-23 11:37:02.776955
- Title: Multi-Scale U-Shape MLP for Hyperspectral Image Classification
- Title(参考訳): ハイパースペクトル画像分類のためのマルチスケールU字型MLP
- Authors: Moule Lin, Weipeng Jing, Donglin Di, Guangsheng Chen, Houbing Song
- Abstract要約: ハイパースペクトル画像の画素を識別する2つの課題は、局所的および大域的な相関情報と、モデルの豊富なパラメータをそれぞれ表現することである。
設計したMSC(Multi-Scale Channel)ブロックとU字型Multi-Layer Perceptron構造からなるマルチスケールU字型MUMLP(MUMLP)モデルを提案する。
我々のモデルは、広範囲に登録された3つの公開データセット上で、最先端の手法より優れている。
- 参考スコア(独自算出の注目度): 13.85573689689951
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Hyperspectral images have significant applications in various domains, since
they register numerous semantic and spatial information in the spectral band
with spatial variability of spectral signatures. Two critical challenges in
identifying pixels of the hyperspectral image are respectively representing the
correlated information among the local and global, as well as the abundant
parameters of the model. To tackle this challenge, we propose a Multi-Scale
U-shape Multi-Layer Perceptron (MUMLP) a model consisting of the designed MSC
(Multi-Scale Channel) block and the UMLP (U-shape Multi-Layer Perceptron)
structure. MSC transforms the channel dimension and mixes spectral band feature
to embed the deep-level representation adequately. UMLP is designed by the
encoder-decoder structure with multi-layer perceptron layers, which is capable
of compressing the large-scale parameters. Extensive experiments are conducted
to demonstrate our model can outperform state-of-the-art methods
across-the-board on three wide-adopted public datasets, namely Pavia
University, Houston 2013 and Houston 2018
- Abstract(参考訳): スペクトル信号の空間的可変性を持つスペクトル帯域に多くの意味情報や空間情報を登録するため、ハイパースペクトル画像は様々な領域で重要な応用がある。
ハイパースペクトル画像の画素を識別する2つの重要な課題は、それぞれ、局所的および大域的、およびモデルの豊富なパラメータ間の相関情報を表現している。
この課題に対処するために,MUMLP(Multi-Scale Channel)ブロックとUMLP(U-shape Multi-Layer Perceptron)構造からなるマルチスケールU層パーセプトロンを提案する。
MSCはチャネル次元を変換し、スペクトル帯域の特徴を混合し、ディープレベル表現を適切に埋め込む。
UMLPは、大規模パラメータを圧縮できる多層パーセプトロン層を持つエンコーダデコーダ構造で設計されている。
大規模な実験により、我々のモデルは、パヴィア大学、ヒューストン2013、ヒューストン2018の3つの広義の公開データセット上で、最先端の手法よりも優れた性能を発揮することを示した。
関連論文リスト
- HyperSIGMA: Hyperspectral Intelligence Comprehension Foundation Model [88.13261547704444]
Hyper SIGMAは、HSI解釈のためのビジョントランスフォーマーベースの基礎モデルである。
特別に設計されたスペクトル拡張モジュールを使用して、空間的特徴とスペクトル的特徴を統合する。
スケーラビリティ、堅牢性、クロスモーダル転送能力、実世界の適用性において大きなメリットがある。
論文 参考訳(メタデータ) (2024-06-17T13:22:58Z) - Multi-view Aggregation Network for Dichotomous Image Segmentation [76.75904424539543]
Dichotomous Image (DIS) は近年,高解像度自然画像からの高精度物体分割に向けて出現している。
既存の手法は、グローバルなローカライゼーションと局所的な洗練を徐々に完了させるために、退屈な複数のエンコーダ・デコーダストリームとステージに依存している。
これに触発されて、我々は多視点オブジェクト認識問題としてdisをモデル化し、擬似多視点アグリゲーションネットワーク(MVANet)を提供する。
一般的なdis-5Kデータセットの実験では、我々のMVANetは精度と速度の両方で最先端の手法を大きく上回っている。
論文 参考訳(メタデータ) (2024-04-11T03:00:00Z) - MultiScale Spectral-Spatial Convolutional Transformer for Hyperspectral
Image Classification [9.051982753583232]
Transformerはハイパースペクトル画像分類のためのCNNの代替アーキテクチャとなっている。
ハイパースペクトル画像分類のためのマルチスケールスペクトル空間畳み込み変換器(MultiscaleFormer)を提案する。
論文 参考訳(メタデータ) (2023-10-28T00:41:35Z) - Multiview Transformer: Rethinking Spatial Information in Hyperspectral
Image Classification [43.17196501332728]
ハイパースペクトル画像における各画素のランドカバーカテゴリの同定は、スペクトル情報と空間情報に依存する。
本稿では,シーン固有であるが本質的でない相関関係がHSIカブイドに記録される可能性があることを考察する。
本稿では、マルチビュー主成分分析(MPCA)、スペクトルエンコーダデコーダ(SED)、空間プールトークン化変換(SPTT)からなるHSI分類のためのマルチビュー変換器を提案する。
論文 参考訳(メタデータ) (2023-10-11T04:25:24Z) - Multi-Spectral Image Stitching via Spatial Graph Reasoning [52.27796682972484]
空間グラフ推論に基づくマルチスペクトル画像縫合法を提案する。
同一のビュー位置から複数スケールの補完機能をノードに埋め込む。
空間的・チャネル的次元に沿った長距離コヒーレンスを導入することにより、画素関係の相補性とチャネル相互依存性は、整列したマルチビュー特徴の再構築に寄与する。
論文 参考訳(メタデータ) (2023-07-31T15:04:52Z) - AerialFormer: Multi-resolution Transformer for Aerial Image Segmentation [7.415370401064414]
AerialFormerは,契約経路におけるトランスフォーマーと,拡張経路における軽量なMD-CNN(Multi-Dilated Conal Neural Networks)を一体化する。
我々のAerialFormerは階層構造として設計されており、Transformerはマルチスケール機能を出力し、MD-CNNはマルチスケールから情報を集約する。
AerialFormerをiSAID、LoveDA、Potsdamの3つの一般的なデータセットでベンチマークしました。
論文 参考訳(メタデータ) (2023-06-12T03:28:18Z) - Multi-spectral Class Center Network for Face Manipulation Detection and Localization [52.569170436393165]
顔の操作検出と局所化のための新しいマルチスペクトル・クラス・センター・ネットワーク(MSCCNet)を提案する。
周波数帯域の異なる特徴に基づき、MSCCモジュールはマルチスペクトルクラスセンターを収集し、ピクセル対クラス関係を計算する。
多スペクトルクラスレベルの表現を適用することで、偽画像の操作された領域に敏感な視覚概念の意味情報を抑えることができる。
論文 参考訳(メタデータ) (2023-05-18T08:09:20Z) - Multi-level Second-order Few-shot Learning [111.0648869396828]
教師付きまたは教師なしの少数ショット画像分類と少数ショット動作認識のためのマルチレベル2次数列学習ネットワーク(MlSo)を提案する。
我々は、パワーノーマライズされた二階学習者ストリームと、複数のレベルの視覚的抽象化を表現する機能を組み合わせた、いわゆる2階学習者ストリームを活用している。
我々は,Omniglot, mini-ImageNet, tiered-ImageNet, Open MIC, CUB Birds, Stanford Dogs, Cars, HMDB51, UCF101, mini-MITなどのアクション認識データセットなどの標準データセットに対して,優れた結果を示す。
論文 参考訳(メタデータ) (2022-01-15T19:49:00Z) - Polyp-PVT: Polyp Segmentation with Pyramid Vision Transformers [124.01928050651466]
本稿では,Polyp-PVTと呼ばれる新しいタイプのPolypセグメンテーション手法を提案する。
提案モデルであるPolyp-PVTは,特徴の雑音を効果的に抑制し,その表現能力を大幅に向上させる。
論文 参考訳(メタデータ) (2021-08-16T07:09:06Z) - Learning deep multiresolution representations for pansharpening [4.469255274378329]
本稿では,異なるスケールでスペクトル特性と空間特性を保持するピラミッド型深層融合フレームワークを提案する。
実験により,提案手法はアートパンシャープニングモデルよりも優れていることが示唆された。
論文 参考訳(メタデータ) (2021-02-16T19:41:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。