論文の概要: ISWSST: Index-space-wave State Superposition Transformers for Multispectral Remotely Sensed Imagery Semantic Segmentation
- arxiv url: http://arxiv.org/abs/2407.03033v1
- Date: Wed, 3 Jul 2024 11:54:17 GMT
- ステータス: 処理完了
- システム内更新日: 2024-07-04 14:35:46.898046
- Title: ISWSST: Index-space-wave State Superposition Transformers for Multispectral Remotely Sensed Imagery Semantic Segmentation
- Title(参考訳): ISWSST:マルチスペクトルリモートセンシング画像セマンティックセマンティックセグメンテーションのための指数空間-波状態重畳変換器
- Authors: Chang Li, Pengfei Zhang, Yu Wang,
- Abstract要約: Index-space-wave state superposition Transformer (ISWSST) は、MSRSIセマンティックセグメンテーションのために提案される最初の方法である。
ISWSSTは、MSRSIセグメンテーションタスクの最先端アーキテクチャよりも検証され、優れている。
- 参考スコア(独自算出の注目度): 8.70782042307399
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Currently the semantic segmentation task of multispectral remotely sensed imagery (MSRSI) faces the following problems: 1) Usually, only single domain feature (i.e., space domain or frequency domain) is considered; 2) downsampling operation in encoder generally leads to the accuracy loss of edge extraction; 3) multichannel features of MSRSI are not fully considered; and 4) prior knowledge of remote sensing is not fully utilized. To solve the aforementioned issues, an index-space-wave state superposition Transformer (ISWSST) is the first to be proposed for MSRSI semantic segmentation by the inspiration from quantum mechanics, whose superiority is as follows: 1) index, space and wave states are superposed or fused to simulate quantum superposition by adaptively voting decision (i.e., ensemble learning idea) for being a stronger classifier and improving the segmentation accuracy; 2) a lossless wavelet pyramid encoder-decoder module is designed to losslessly reconstruct image and simulate quantum entanglement based on wavelet transform and inverse wavelet transform for avoiding the edge extraction loss; 3) combining multispectral features (i.e. remote sensing index and channel attention mechanism) is proposed to accurately extract ground objects from original resolution images; and 4) quantum mechanics are introduced to interpret the underlying superiority of ISWSST. Experiments show that ISWSST is validated and superior to the state-of-the-art architectures for the MSRSI segmentation task, which improves the segmentation and edge extraction accuracy effectively. Codes will be available publicly after our paper is accepted.
- Abstract(参考訳): 現在、マルチスペクトルリモートセンシング画像(MSRSI)のセグメンテーションタスクは以下の問題に直面している。
1) 通常,単一の領域の特徴(すなわち,空間領域又は周波数領域)のみが考慮される。
2) エンコーダのダウンサンプリング操作は,一般的に,エッジ抽出の精度の低下につながる。
3) MSRSIのマルチチャネル機能は十分に考慮されていない。
4) リモートセンシングの事前知識は十分に活用されていない。
上記の問題を解決するため、ISWSST(Index-space-wave State Superposition Transformer)は、量子力学のインスピレーションにより、MSRSIセマンティックセグメンテーションのために最初に提案される。
1) 索引、空間及び波動状態は、より強力な分類器であり、セグメンテーション精度を向上させるための決定(すなわち、アンサンブル学習のアイデア)を適応的に投票することで、量子的重ね合わせをシミュレートするために重畳または融合される。
2 ロスレスウェーブレットピラミッドエンコーダモジュールは、エッジ抽出損失を回避するために、ウェーブレット変換と逆ウェーブレット変換に基づいて、画像のロスレス再構成と量子絡み合わせをシミュレートするように設計されている。
3)マルチスペクトル特徴(リモートセンシング指標とチャネルアテンション機構)を組み合わせることで、元の解像度画像からグラウンドオブジェクトを正確に抽出する。
4)ISWSSTの基本的な優位性を解釈するために量子力学を導入する。
実験の結果,ISWSSTはMSRSIセグメンテーションタスクの最先端アーキテクチャよりも優れており,セグメンテーションとエッジ抽出の精度が向上していることがわかった。
私たちの論文が受理されたら、コードは公開されます。
関連論文リスト
- ΩSFormer: Dual-Modal Ω-like Super-Resolution Transformer Network for Cross-scale and High-accuracy Terraced Field Vectorization Extraction [14.821191612452418]
棚田は土壌・水質保全(SWC)の重要な工学的実践である
本研究は,知的TFVEのための新しい2モードOmega型超解像トランスネットワークを提案する最初のものである。
論文 参考訳(メタデータ) (2024-11-26T04:00:28Z) - Rethinking Decoders for Transformer-based Semantic Segmentation: Compression is All You Need [3.218600495900291]
セマンティックセグメンテーションと圧縮の間には根本的な関係があることを論じる。
PrIncipled SemantiC SegemenTation(DEPICT)のためのホワイトボックス完全注意型Decoderを考案した。
ADE20Kで行った実験では、DEPICTはブラックボックスであるSegmenterよりも一貫して優れていた。
論文 参考訳(メタデータ) (2024-11-05T12:10:02Z) - Wavelet-based Bi-dimensional Aggregation Network for SAR Image Change Detection [53.842568573251214]
3つのSARデータセットによる実験結果から、我々のWBANetは現代最先端の手法を著しく上回っていることが明らかとなった。
我々のWBANetは、それぞれのデータセットで98.33%、96.65%、96.62%の正確な分類(PCC)を達成している。
論文 参考訳(メタデータ) (2024-07-18T04:36:10Z) - UDHF2-Net: Uncertainty-diffusion-model-based High-Frequency TransFormer Network for Remotely Sensed Imagery Interpretation [12.24506241611653]
不確実拡散モデルに基づく高周波トランスフォーマーネットワーク(UDHF2-Net)が最初に提案される。
UDHF2-Netは空間定常非定常高周波接続パラダイム(SHCP)である
Mask-and-geo-knowledge-based uncertainty diffusion module (MUDM) は自己指導型学習戦略である。
周波数ワイド半擬似半擬似UDHF2-Netは、変更検出の精度と複雑さのバランスをとるために提案された最初のものである。
論文 参考訳(メタデータ) (2024-06-23T15:03:35Z) - S^2-Transformer for Mask-Aware Hyperspectral Image Reconstruction [48.83280067393851]
代表的ハイパースペクトル画像取得手順は、符号化開口分光画像センサ(CASSI)による3D-to-2D符号化を行う
i) 2次元計測を得るために、CASSIは分散器タイトリングにより複数のチャネルを分散させ、それらを同じ空間領域に絞り込み、絡み合ったデータ損失をもたらす。
本稿では,これらの課題に対処するためのマスク対応学習戦略を備えた空間スペクトル(S2-)トランスフォーマーアーキテクチャを提案する。
論文 参考訳(メタデータ) (2022-09-24T19:26:46Z) - Degradation-Aware Unfolding Half-Shuffle Transformer for Spectral
Compressive Imaging [142.11622043078867]
圧縮画像と物理マスクからパラメータを推定し,これらのパラメータを用いて各イテレーションを制御する,DAUF(Degradation-Aware Unfolding Framework)を提案する。
HST を DAUF に接続することにより,HSI 再構成のための変換器の深部展開法であるデグレーション・アウェア・アンフォールディング・ハーフシャッフル変換器 (DAUHST) を確立した。
論文 参考訳(メタデータ) (2022-05-20T11:37:44Z) - Coarse-to-Fine Sparse Transformer for Hyperspectral Image Reconstruction [138.04956118993934]
本稿では, サース・トゥ・ファインス・スパース・トランス (CST) を用いた新しいトランス方式を提案する。
HSI再構成のための深層学習にHSI空間を埋め込んだCST
特に,CSTは,提案したスペクトル認識スクリーニング機構(SASM)を粗いパッチ選択に使用し,選択したパッチを,細かなピクセルクラスタリングと自己相似性キャプチャのために,カスタマイズしたスペクトル集約ハッシュ型マルチヘッド自己アテンション(SAH-MSA)に入力する。
論文 参考訳(メタデータ) (2022-03-09T16:17:47Z) - Polarimetric SAR Image Semantic Segmentation with 3D Discrete Wavelet
Transform and Markov Random Field [32.59900433812833]
本稿では,文脈的PolSAR画像セマンティックセグメンテーション手法を提案する。
3D-DWT手法は,新たに定義したチャネル的に一貫した特徴を入力として,スペックルノイズに頑健な識別的マルチスケール特徴を抽出する。
3D-DWT機能とMRFプリエントを同時に活用することにより、セグメンテーション中にコンテキスト情報が完全に統合され、正確かつスムーズなセグメンテーションが保証される。
論文 参考訳(メタデータ) (2020-08-05T08:28:18Z) - Bi-directional Cross-Modality Feature Propagation with
Separation-and-Aggregation Gate for RGB-D Semantic Segmentation [59.94819184452694]
深度情報はRGBD画像のセマンティックセグメンテーションにおいて有用であることが証明されている。
既存のほとんどの研究は、深度測定がRGBピクセルと正確で整合していると仮定し、問題をモーダルな特徴融合としてモデル化している。
本稿では,RGB特徴量応答を効果的に再検討するだけでなく,複数の段階を通して正確な深度情報を抽出し,代わりに2つの補正表現を集約する,統一的で効率的なクロスモダリティガイドを提案する。
論文 参考訳(メタデータ) (2020-07-17T18:35:24Z) - Suppress and Balance: A Simple Gated Network for Salient Object
Detection [89.88222217065858]
両問題を同時に解くための単純なゲートネットワーク(GateNet)を提案する。
多レベルゲートユニットの助けを借りて、エンコーダからの貴重なコンテキスト情報をデコーダに最適に送信することができる。
さらに,提案したFold-ASPP操作(Fold-ASPP)に基づくアトラス空間ピラミッドプーリングを用いて,様々なスケールのサリアンオブジェクトを正確に位置決めする。
論文 参考訳(メタデータ) (2020-07-16T02:00:53Z) - Spatial-Scale Aligned Network for Fine-Grained Recognition [42.71878867504503]
精密な視覚認識のための既存のアプローチは、境界領域に基づく表現の学習に重点を置いている。
本稿では,空間スケールアライメントネットワーク(SSANET)を提案する。
論文 参考訳(メタデータ) (2020-01-05T11:12:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。