論文の概要: SBSS: Stacking-Based Semantic Segmentation Framework for Very High
Resolution Remote Sensing Image
- arxiv url: http://arxiv.org/abs/2212.07623v1
- Date: Thu, 15 Dec 2022 05:43:21 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-16 17:01:45.078989
- Title: SBSS: Stacking-Based Semantic Segmentation Framework for Very High
Resolution Remote Sensing Image
- Title(参考訳): SBSS:超高解像度リモートセンシング画像のためのスタックベースセマンティックセマンティックセグメンテーションフレームワーク
- Authors: Yuanzhi Cai, Lei Fan, and Yuan Fang
- Abstract要約: 超高分解能(VHR)リモートセンシング画像におけるオブジェクトのスケールの大きなバリエーションは、正確なセマンティックセグメンテーションを実行する上での課題である。
既存のセマンティックセグメンテーションネットワークは、最大4つのリサイズスケールで入力画像を分析することができるが、オブジェクトスケールの多様性を考えると、これは不十分である。
SBSS(Stacking-Based Semantic)フレームワークは、この振る舞いを学習することでセグメンテーション結果を改善するために提案されている。
- 参考スコア(独自算出の注目度): 12.10124344168457
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Semantic segmentation of Very High Resolution (VHR) remote sensing images is
a fundamental task for many applications. However, large variations in the
scales of objects in those VHR images pose a challenge for performing accurate
semantic segmentation. Existing semantic segmentation networks are able to
analyse an input image at up to four resizing scales, but this may be
insufficient given the diversity of object scales. Therefore, Multi Scale (MS)
test-time data augmentation is often used in practice to obtain more accurate
segmentation results, which makes equal use of the segmentation results
obtained at the different resizing scales. However, it was found in this study
that different classes of objects had their preferred resizing scale for more
accurate semantic segmentation. Based on this behaviour, a Stacking-Based
Semantic Segmentation (SBSS) framework is proposed to improve the segmentation
results by learning this behaviour, which contains a learnable Error Correction
Module (ECM) for segmentation result fusion and an Error Correction Scheme
(ECS) for computational complexity control. Two ECS, i.e., ECS-MS and ECS-SS,
are proposed and investigated in this study. The Floating-point operations
(Flops) required for ECS-MS and ECS-SS are similar to the commonly used MS test
and the Single-Scale (SS) test, respectively. Extensive experiments on four
datasets (i.e., Cityscapes, UAVid, LoveDA and Potsdam) show that SBSS is an
effective and flexible framework. It achieved higher accuracy than MS when
using ECS-MS, and similar accuracy as SS with a quarter of the memory footprint
when using ECS-SS.
- Abstract(参考訳): 超高解像度(VHR)リモートセンシング画像のセマンティックセグメンテーションは多くのアプリケーションにおいて基本的な課題である。
しかしながら、これらのVHR画像におけるオブジェクトのスケールの大きなバリエーションは、正確なセマンティックセグメンテーションを実行する上での課題である。
既存のセマンティックセグメンテーションネットワークは、最大4回のリサイズスケールで入力画像を分析することができるが、オブジェクトスケールの多様性を考えると不十分かもしれない。
したがって、より正確なセグメンテーション結果を得るためには、多スケール(ms)テスト時データ拡張が実際にしばしば用いられ、異なる再サイズスケールで得られたセグメンテーション結果が等しく使用される。
しかし、本研究では、より正確なセマンティックセグメンテーションのために、異なる種類のオブジェクトが好まれるサイズ尺度を持つことが判明した。
この挙動に基づいて,この動作を学習することでセグメント化結果を改善するためのスタック型意味セグメンテーション(sbss)フレームワークを提案し,セグメント化結果融合のための学習可能な誤り訂正モジュール(ecm)と計算複雑性制御のための誤り訂正スキーム(ecs)を含む。
本研究では,ECS-MSとECS-SSの2つのECSについて検討した。
ECS-MSとECS-SSに必要な浮動小数点演算(Flops)は、よく使われるMSテストとシングルスケール(SS)テストと似ている。
4つのデータセット(Cityscapes、UAVid、LoveDA、Potsdam)に対する大規模な実験は、SBSSが効果的で柔軟なフレームワークであることを示している。
ECS-MSを使用する場合のMSよりも精度が高く、ECS-SSを使用する場合のメモリフットプリントの4分の1のSSと同様の精度であった。
関連論文リスト
- Hyperspectral Imaging-Based Perception in Autonomous Driving Scenarios: Benchmarking Baseline Semantic Segmentation Models [3.6096086024478775]
ハイパースペクトルイメージング(HSI)は、リモートセンシング、農業、医療における従来のRGBイメージングよりも優れていることで知られている。
HyKo、HSI-Drive、HSI-Road、Hyperspectral CityといったいくつかのHSIデータセットが利用可能になっている。
しかし,これらのデータセットを用いたセマンティックセグメンテーションモデル(SSM)の包括的評価は不十分である。
本研究では、HSIに基づくADAS知覚の今後の評価のために、利用可能な注釈付きデータセットのベースラインSSMベンチマークを確立する。
論文 参考訳(メタデータ) (2024-10-29T14:54:13Z) - Multi-Scale Semantic Segmentation with Modified MBConv Blocks [29.026787888644474]
セマンティックセグメンテーションに適したMBConvブロックの新規適応を導入する。
これらの変更を実装することで、Cityscapesのテストおよび検証データセットにおいて、IoU(Intersection over Union)の84.5%と84.0%という印象的な平均値が得られる。
論文 参考訳(メタデータ) (2024-02-07T07:01:08Z) - Rotated Multi-Scale Interaction Network for Referring Remote Sensing Image Segmentation [63.15257949821558]
Referring Remote Sensing Image (RRSIS)は、コンピュータビジョンと自然言語処理を組み合わせた新しい課題である。
従来の参照画像(RIS)アプローチは、空中画像に見られる複雑な空間スケールと向きによって妨げられている。
本稿ではRMSIN(Rotated Multi-Scale Interaction Network)を紹介する。
論文 参考訳(メタデータ) (2023-12-19T08:14:14Z) - GraSS: Contrastive Learning with Gradient Guided Sampling Strategy for
Remote Sensing Image Semantic Segmentation [14.750062497258147]
RSIセマンティックセグメンテーションのためのGradient Guided Smpling Strategy (GraSS) を用いたコントラスト学習を提案する。
GraSSは2つのステージで構成されている。
GraSSは高分解能RSIセマンティックセグメンテーションにおけるSSCLの性能を効果的に向上させる。
論文 参考訳(メタデータ) (2023-06-28T01:50:46Z) - SAMRS: Scaling-up Remote Sensing Segmentation Dataset with Segment
Anything Model [85.85899655118087]
我々はSAMRSと呼ばれる大規模RSセグメンテーションデータセットを生成するための効率的なパイプラインを開発する。
SAMRSは完全に105,090の画像と1,668,241のインスタンスを持ち、既存の高解像度RSセグメンテーションデータセットを数桁上回っている。
論文 参考訳(メタデータ) (2023-05-03T10:58:07Z) - Learning Self-Supervised Low-Rank Network for Single-Stage Weakly and
Semi-Supervised Semantic Segmentation [119.009033745244]
本稿では,単一段階弱教師付きセマンティックセマンティックセマンティックセマンティクス(WSSS)と半教師付きセマンティクスセマンティクスセマンティクス(SSSS)のための自己教師付き低ランクネットワーク(SLRNet)を提案する。
SLRNetは、画像の異なるビューから複数の注意深いLR表現を同時に予測し、正確な擬似ラベルを学習する。
Pascal VOC 2012、COCO、L2IDデータセットの実験では、SLRNetは最先端のWSSSメソッドとSSSSメソッドの両方で、さまざまな設定で優れています。
論文 参考訳(メタデータ) (2022-03-19T09:19:55Z) - AF$_2$: Adaptive Focus Framework for Aerial Imagery Segmentation [86.44683367028914]
航空画像のセグメンテーションにはいくつかの独特な課題があり、中でも最も重要なものは前景と背景のアンバランスにある。
本稿では,階層的なセグメンテーション手法を採用し,マルチスケール表現を適応的に活用するAdaptive Focus Framework (AF$)を提案する。
AF$は、広く使われている3つの航空ベンチマークの精度を大幅に改善した。
論文 参考訳(メタデータ) (2022-02-18T10:14:45Z) - Improving Semi-Supervised and Domain-Adaptive Semantic Segmentation with
Self-Supervised Depth Estimation [94.16816278191477]
本稿では,セミアダプティブなセマンティックセマンティックセマンティックセグメンテーションのためのフレームワークを提案する。
ラベルのない画像シーケンスでのみ訓練された自己教師付き単眼深度推定によって強化される。
提案したモデルをCityscapesデータセット上で検証する。
論文 参考訳(メタデータ) (2021-08-28T01:33:38Z) - Semantic Attention and Scale Complementary Network for Instance
Segmentation in Remote Sensing Images [54.08240004593062]
本稿では,セマンティックアテンション(SEA)モジュールとスケール補完マスクブランチ(SCMB)で構成される,エンドツーエンドのマルチカテゴリインスタンスセグメンテーションモデルを提案する。
SEAモジュールは、機能マップ上の興味あるインスタンスのアクティベーションを強化するために、追加の監督を備えた、単純な完全な畳み込みセマンティックセマンティックセマンティクスブランチを含んでいる。
SCMBは、元のシングルマスクブランチをトリデントマスクブランチに拡張し、異なるスケールで補完マスクの監視を導入する。
論文 参考訳(メタデータ) (2021-07-25T08:53:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。