論文の概要: EHSNet: End-to-End Holistic Learning Network for Large-Size Remote
Sensing Image Semantic Segmentation
- arxiv url: http://arxiv.org/abs/2211.11316v2
- Date: Tue, 11 Apr 2023 03:48:40 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-12 18:39:19.869902
- Title: EHSNet: End-to-End Holistic Learning Network for Large-Size Remote
Sensing Image Semantic Segmentation
- Title(参考訳): EHSNet:大規模リモートセンシング画像セマンティックセグメンテーションのためのエンドツーエンドホロスティック学習ネットワーク
- Authors: Wei Chen, Yansheng Li, Bo Dang, Yongjun Zhang
- Abstract要約: 本稿では,大規模リモートセンシング画像セマンティックセマンティックセマンティックセマンティクス(LRISS)の総合学習を目的とした,新しいエンドツーエンドセマンティクスネットワークであるEHSNetを提案する。
EHSNetは、LRIの特徴を利用するための3つのメモリフレンドリなモジュール、長距離空間コンテキストを開発するための長距離依存モジュール、全体的コンテキスト関係を構築するための効率的な相互相関モジュール、完全なオブジェクト境界を保存するための境界認識拡張モジュールである。
より良くするために、EHSNetはFBPと+4で+5.65 mIoUの差で従来の最先端のライバルより優れていた。
- 参考スコア(独自算出の注目度): 9.704776038367262
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper presents EHSNet, a new end-to-end segmentation network designed
for the holistic learning of large-size remote sensing image semantic
segmentation (LRISS). Large-size remote sensing images (LRIs) can lead to GPU
memory exhaustion due to their extremely large size, which has been handled in
previous works through either global-local fusion or multi-stage refinement,
both of which are limited in their ability to fully exploit the abundant
information available in LRIs. Unlike them, EHSNet features three
memory-friendly modules to utilize the characteristics of LRIs: a long-range
dependency module to develop long-range spatial context, an efficient
cross-correlation module to build holistic contextual relationships, and a
boundary-aware enhancement module to preserve complete object boundaries.
Moreover, EHSNet manages to process holistic LRISS with the aid of memory
offloading. To the best of our knowledge, EHSNet is the first method capable of
performing holistic LRISS. To make matters better, EHSNet outperforms previous
state-of-the-art competitors by a significant margin of +5.65 mIoU on FBP and
+4.28 mIoU on Inria Aerial, demonstrating its effectiveness. We hope that
EHSNet will provide a new perspective for LRISS. The code and models will be
made publicly available.
- Abstract(参考訳): 本稿では,大規模リモートセンシング画像セマンティクスセグメンテーション(lriss)の総合学習を目的とした,新しいエンドツーエンドセグメンテーションネットワークであるeesnetを提案する。
大規模なリモートセンシング画像(LRI)は、非常に大きなサイズのため、GPUメモリの枯渇につながる可能性がある。
それらとは異なり、EHSNetはLRIの特徴を利用するための3つのメモリフレンドリなモジュール、長距離空間コンテキストを開発する長距離依存モジュール、全体的コンテキスト関係を構築するための効率的な相互相関モジュール、完全なオブジェクト境界を維持するための境界認識拡張モジュールを備えている。
さらに、EHSNetはメモリオフロードの助けを借りて、完全なLRISSを処理している。
我々の知る限りでは、EHSNetはホロスティックLRISSを実行する最初の方法である。
EHSNetは、FBPでは+5.65 mIoU、Inria Aerialでは+4.28 mIoUという大きなマージンで、従来の最先端のライバルより優れている。
EHSNetがLRISSの新しい視点を提供することを期待しています。
コードとモデルは公開される予定だ。
関連論文リスト
- Salient Object Detection in Optical Remote Sensing Images Driven by
Transformer [69.22039680783124]
光リモートセンシング画像(ORSI-SOD)のためのGlobal extract Local Exploration Network(GeleNet)を提案する。
具体的には、GeleNetはまずトランスフォーマーバックボーンを採用し、グローバルな長距離依存関係を持つ4レベルの機能埋め込みを生成する。
3つの公開データセットに関する大規模な実験は、提案されたGeleNetが関連する最先端メソッドより優れていることを示している。
論文 参考訳(メタデータ) (2023-09-15T07:14:43Z) - Lightweight and Progressively-Scalable Networks for Semantic
Segmentation [100.63114424262234]
マルチスケール学習フレームワークは,セマンティックセグメンテーションを向上する有効なモデルのクラスと見なされてきた。
本稿では,畳み込みブロックの設計と,複数スケールにわたる相互作用の仕方について,徹底的に解析する。
我々は,軽量で拡張性の高いネットワーク(LPS-Net)を考案した。
論文 参考訳(メタデータ) (2022-07-27T16:00:28Z) - Highly Accurate Dichotomous Image Segmentation [139.79513044546]
Dichotomous Image segmentation (DIS)と呼ばれる新しいタスクは、自然画像から高度に正確な物体を抽出することを目的としている。
私たちは、5,470の高解像度画像(例えば、2K、4K以上の画像)を含む最初の大規模データセットdis5Kを収集します。
また、Disdisモデルトレーニングのための特徴レベルとマスクレベルの両方のガイダンスを用いて、単純な中間監視ベースライン(IS-Net)を導入する。
論文 参考訳(メタデータ) (2022-03-06T20:09:19Z) - Multi-Content Complementation Network for Salient Object Detection in
Optical Remote Sensing Images [108.79667788962425]
光リモートセンシング画像(RSI-SOD)における有能な物体検出は、いまだに課題である。
本稿では, RSI-SOD における複数コンテンツの相補性を検討するために, MCCNet (Multi-Content Complementation Network) を提案する。
MCCMでは、前景機能、エッジ機能、背景機能、グローバル画像レベル機能など、RSI-SODにとって重要な複数の機能について検討する。
論文 参考訳(メタデータ) (2021-12-02T04:46:40Z) - CSRNet: Cascaded Selective Resolution Network for Real-time Semantic
Segmentation [18.63596070055678]
本稿では,リアルタイムセグメンテーションの性能向上を図るために,光カスケード選択分解ネットワーク(CSRNet)を提案する。
提案するネットワークは,低解像度から高解像度までの特徴情報を統合した3段階セグメンテーションシステムを構築している。
2つのよく知られたデータセットの実験により、提案したCSRNetはリアルタイムセグメンテーションの性能を効果的に向上することを示した。
論文 参考訳(メタデータ) (2021-06-08T14:22:09Z) - MDA-Net: Multi-Dimensional Attention-Based Neural Network for 3D Image
Segmentation [4.221871357181261]
マルチ次元アテンションネットワーク(MDA-Net)を提案し,スライスワイド,空間,チャネルワイドアテンションを効率よくU-Netネットワークに統合する。
MICCAI iSegおよびIBSRデータセット上のモデルを評価し、実験結果が既存の方法よりも一貫した改善を示した。
論文 参考訳(メタデータ) (2021-05-10T16:58:34Z) - Cross-Attention in Coupled Unmixing Nets for Unsupervised Hyperspectral
Super-Resolution [79.97180849505294]
本稿では,HSIの空間分解能を高めるために,CUCaNetというクロスアテンション機構を備えた新しい結合型アンミックスネットワークを提案する。
3つの広く使われているHS-MSデータセットに対して、最先端のHSI-SRモデルと比較実験を行った。
論文 参考訳(メタデータ) (2020-07-10T08:08:20Z) - X-ModalNet: A Semi-Supervised Deep Cross-Modal Network for
Classification of Remote Sensing Data [69.37597254841052]
我々はX-ModalNetと呼ばれる新しいクロスモーダルディープラーニングフレームワークを提案する。
X-ModalNetは、ネットワークの上部にある高レベルな特徴によって構築されたアップダスタブルグラフ上にラベルを伝搬するため、うまく一般化する。
我々は2つのマルチモーダルリモートセンシングデータセット(HSI-MSIとHSI-SAR)上でX-ModalNetを評価し、いくつかの最先端手法と比較して大幅に改善した。
論文 参考訳(メタデータ) (2020-06-24T15:29:41Z) - GSANet: Semantic Segmentation with Global and Selective Attention [37.26671754212935]
セマンティックセグメンテーションのための新しいディープラーニングアーキテクチャを提案する。
我々はGSANetがMobileNetEdgeとより正確なセグメンテーションをもたらすことを示し、Xceptionのような強力なFXNを持つことを示した。
GSANetはADE20kとCityscapesのデータセットの最先端セマンティックセマンティックセマンティクスの精度を改善している。
論文 参考訳(メタデータ) (2020-02-14T00:09:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。