論文の概要: Seeing Beyond the Patch: Scale-Adaptive Semantic Segmentation of
High-resolution Remote Sensing Imagery based on Reinforcement Learning
- arxiv url: http://arxiv.org/abs/2309.15372v1
- Date: Wed, 27 Sep 2023 02:48:04 GMT
- ステータス: 処理完了
- システム内更新日: 2023-09-28 16:58:59.219226
- Title: Seeing Beyond the Patch: Scale-Adaptive Semantic Segmentation of
High-resolution Remote Sensing Imagery based on Reinforcement Learning
- Title(参考訳): パッチを超えて見る:強化学習に基づく高解像度リモートセンシング画像のスケール適応セマンティックセマンティックセグメンテーション
- Authors: Yinhe Liu, Sunan Shi, Junjue Wang, Yanfei Zhong
- Abstract要約: 画像パッチ外の適切なスケールコンテキスト情報を適応的にキャプチャする動的スケール認識フレームワークGeoAgentを提案する。
現在の画像パッチの位置を識別する能力を高めるために,特徴指標モジュールを提案する。
2つの公開データセットと新たに構築したデータセット WUSU を用いて実験した結果,GeoAgent が従来のセグメンテーション手法より優れていることが示された。
- 参考スコア(独自算出の注目度): 8.124633573706763
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In remote sensing imagery analysis, patch-based methods have limitations in
capturing information beyond the sliding window. This shortcoming poses a
significant challenge in processing complex and variable geo-objects, which
results in semantic inconsistency in segmentation results. To address this
challenge, we propose a dynamic scale perception framework, named GeoAgent,
which adaptively captures appropriate scale context information outside the
image patch based on the different geo-objects. In GeoAgent, each image patch's
states are represented by a global thumbnail and a location mask. The global
thumbnail provides context beyond the patch, and the location mask guides the
perceived spatial relationships. The scale-selection actions are performed
through a Scale Control Agent (SCA). A feature indexing module is proposed to
enhance the ability of the agent to distinguish the current image patch's
location. The action switches the patch scale and context branch of a
dual-branch segmentation network that extracts and fuses the features of
multi-scale patches. The GeoAgent adjusts the network parameters to perform the
appropriate scale-selection action based on the reward received for the
selected scale. The experimental results, using two publicly available datasets
and our newly constructed dataset WUSU, demonstrate that GeoAgent outperforms
previous segmentation methods, particularly for large-scale mapping
applications.
- Abstract(参考訳): リモートセンシング画像解析では、パッチベースの手法はスライディングウィンドウを超えて情報をキャプチャする制限がある。
この欠点は、複雑で可変なジオオブジェクトを処理する上で大きな課題となり、セグメンテーション結果のセグメンテーションの不整合をもたらす。
この課題に対処するため,我々はGeoAgentという動的スケール認識フレームワークを提案し,異なるジオオブジェクトに基づいて画像パッチ外の適切なスケールコンテキスト情報を適応的にキャプチャする。
GeoAgentでは、各イメージパッチの状態はグローバルサムネイルとロケーションマスクで表現される。
グローバルサムネイルはパッチを超えてコンテキストを提供し、位置マスクは知覚された空間的関係を導く。
スケール選択動作はスケール制御エージェント(SCA)を介して実行される。
現在のイメージパッチの位置を識別するエージェントの能力を高めるために、機能インデクシングモジュールが提案されている。
このアクションは、マルチスケールパッチの特徴を抽出して融合するデュアルブランチセグメンテーションネットワークのパッチスケールとコンテキストブランチを切り替える。
GeoAgentは、選択されたスケールに対する報酬に基づいて、ネットワークパラメータを調整して適切なスケール選択アクションを実行する。
2つの公開データセットと新たに構築したデータセット WUSU を用いた実験結果は,GeoAgent が特に大規模マッピングアプリケーションにおいて,従来のセグメンテーション手法よりも優れていることを示す。
関連論文リスト
- Pattern Integration and Enhancement Vision Transformer for Self-Supervised Learning in Remote Sensing [11.626527403157922]
本稿では、リモートセンシング画像のための新しい自己教師型学習フレームワークであるPattern Integration and Enhancement Vision Transformer(PIEViT)を紹介する。
PIEViTは内部パッチ機能の表現を強化し、既存の自己管理ベースラインよりも大幅に改善されている。
オブジェクト検出、土地被覆分類、変更検出において優れた結果が得られ、リモートセンシング画像解釈タスクの堅牢性、一般化、転送性などが評価される。
論文 参考訳(メタデータ) (2024-11-09T07:06:31Z) - AgMTR: Agent Mining Transformer for Few-shot Segmentation in Remote Sensing [12.91626624625134]
Few-shot (FSS) は、関心のあるオブジェクトを少数のラベル付きサンプル(つまりサポートイメージ)でクエリイメージに分割することを目的としている。
以前のスキームでは、サポートクエリのピクセルペア間の類似性を利用して、ピクセルレベルのセマンティックな相関を構築していた。
極端にクラス内変異や乱雑な背景を持つリモートセンシングシナリオでは、そのようなピクセルレベルの相関が大きなミスマッチを引き起こす可能性がある。
本稿では,エージェントレベルの意味的相関を構築するために,一組の局所認識エージェントを適応的にマイニングする新しいエージェントマイニングトランス (AgMTR) を提案する。
論文 参考訳(メタデータ) (2024-09-26T01:12:01Z) - De-coupling and De-positioning Dense Self-supervised Learning [65.56679416475943]
Dense Self-Supervised Learning (SSL)メソッドは、複数のオブジェクトでイメージを処理する際に、画像レベルの特徴表現を使用する際の制限に対処する。
本研究は, 層深度やゼロパディングに伴う受容野の増大によって生じる, 結合と位置バイアスに悩まされていることを示す。
我々はCOCOにおける本手法の利点と、オブジェクト分類、セマンティックセグメンテーション、オブジェクト検出のための新しい挑戦的ベンチマークであるOpenImage-MINIについて示す。
論文 参考訳(メタデータ) (2023-03-29T18:07:25Z) - Cross-view Geo-localization via Learning Disentangled Geometric Layout
Correspondence [11.823147814005411]
クロスビュージオローカライゼーションは、参照ジオタグ付き空中画像データベースとマッチングすることで、クエリーグラウンド画像の位置を推定することを目的としている。
最近の研究は、クロスビューなジオローカライゼーションベンチマークにおいて顕著な進歩を遂げている。
しかし、既存の手法は依然としてクロスエリアベンチマークのパフォーマンスの低下に悩まされている。
論文 参考訳(メタデータ) (2022-12-08T04:54:01Z) - Location-Aware Self-Supervised Transformers [74.76585889813207]
画像部品の相対的な位置を予測し,セマンティックセグメンテーションのためのネットワークを事前訓練する。
参照パッチのサブセットを問合せのサブセットにマスキングすることで,タスクの難しさを制御します。
実験により,この位置認識事前学習が,いくつかの難解なセマンティックセグメンテーションベンチマークに競合する表現をもたらすことが示された。
論文 参考訳(メタデータ) (2022-12-05T16:24:29Z) - Learning Hierarchical Graph Representation for Image Manipulation
Detection [50.04902159383709]
画像操作検出の目的は、画像内の操作された領域を特定し、特定することである。
最近のアプローチでは、画像に残っている改ざんするアーティファクトをキャプチャするために、洗練された畳み込みニューラルネットワーク(CNN)が採用されている。
本稿では2つの並列分岐からなる階層型グラフ畳み込みネットワーク(HGCN-Net)を提案する。
論文 参考訳(メタデータ) (2022-01-15T01:54:25Z) - Augmenting Convolutional networks with attention-based aggregation [55.97184767391253]
我々は,非局所的推論を実現するために,注目に基づくグローバルマップを用いた畳み込みネットワークの強化方法を示す。
この学習集約層を2つのパラメータ(幅と深さ)でパラメータ化した単純パッチベースの畳み込みネットワークで接続する。
これは、特にメモリ消費の点で、精度と複雑さの間の驚くほど競争力のあるトレードオフをもたらす。
論文 参考訳(メタデータ) (2021-12-27T14:05:41Z) - Learning to Aggregate Multi-Scale Context for Instance Segmentation in
Remote Sensing Images [28.560068780733342]
特徴抽出のプロセスを改善するために,新しいコンテキスト集約ネットワーク(CATNet)を提案する。
提案モデルは,高密度特徴ピラミッドネットワーク(DenseFPN),空間コンテキストピラミッド(SCP),階層的関心抽出器(HRoIE)の3つの軽量プラグアンドプレイモジュールを利用する。
論文 参考訳(メタデータ) (2021-11-22T08:55:25Z) - Semantic Attention and Scale Complementary Network for Instance
Segmentation in Remote Sensing Images [54.08240004593062]
本稿では,セマンティックアテンション(SEA)モジュールとスケール補完マスクブランチ(SCMB)で構成される,エンドツーエンドのマルチカテゴリインスタンスセグメンテーションモデルを提案する。
SEAモジュールは、機能マップ上の興味あるインスタンスのアクティベーションを強化するために、追加の監督を備えた、単純な完全な畳み込みセマンティックセマンティックセマンティクスブランチを含んでいる。
SCMBは、元のシングルマスクブランチをトリデントマスクブランチに拡張し、異なるスケールで補完マスクの監視を導入する。
論文 参考訳(メタデータ) (2021-07-25T08:53:59Z) - Hierarchical Attention Fusion for Geo-Localization [7.544917072241684]
地理的ローカライゼーションのためのマルチスケール特徴を用いた階層型アテンション融合ネットワークを提案する。
畳み込みニューラルネットワーク(cnn)から階層的特徴マップを抽出し,抽出した特徴を画像表現に有機的に融合する。
学習は適応重みを用いて自己監督され,各階層レベルから特徴強調の注意を制御できる。
論文 参考訳(メタデータ) (2021-02-18T07:07:03Z) - Spatial Attention Pyramid Network for Unsupervised Domain Adaptation [66.75008386980869]
教師なし領域適応は様々なコンピュータビジョンタスクにおいて重要である。
教師なし領域適応のための新しい空間注意ピラミッドネットワークを設計する。
我々の手法は最先端の手法に対して大きなマージンで好適に機能する。
論文 参考訳(メタデータ) (2020-03-29T09:03:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。