論文の概要: AF$_2$: Adaptive Focus Framework for Aerial Imagery Segmentation
- arxiv url: http://arxiv.org/abs/2202.10322v1
- Date: Fri, 18 Feb 2022 10:14:45 GMT
- ステータス: 処理完了
- システム内更新日: 2022-02-22 15:52:57.047400
- Title: AF$_2$: Adaptive Focus Framework for Aerial Imagery Segmentation
- Title(参考訳): AF$_2$:Aerial Imagery Segmentationのための適応フォーカスフレームワーク
- Authors: Lin Huang, Qiyuan Dong, Lijun Wu, Jia Zhang, Jiang Bian, Tie-Yan Liu
- Abstract要約: 航空画像のセグメンテーションにはいくつかの独特な課題があり、中でも最も重要なものは前景と背景のアンバランスにある。
本稿では,階層的なセグメンテーション手法を採用し,マルチスケール表現を適応的に活用するAdaptive Focus Framework (AF$)を提案する。
AF$は、広く使われている3つの航空ベンチマークの精度を大幅に改善した。
- 参考スコア(独自算出の注目度): 86.44683367028914
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: As a specific semantic segmentation task, aerial imagery segmentation has
been widely employed in high spatial resolution (HSR) remote sensing images
understanding. Besides common issues (e.g. large scale variation) faced by
general semantic segmentation tasks, aerial imagery segmentation has some
unique challenges, the most critical one among which lies in
foreground-background imbalance. There have been some recent efforts that
attempt to address this issue by proposing sophisticated neural network
architectures, since they can be used to extract informative multi-scale
feature representations and increase the discrimination of object boundaries.
Nevertheless, many of them merely utilize those multi-scale representations in
ad-hoc measures but disregard the fact that the semantic meaning of objects
with various sizes could be better identified via receptive fields of diverse
ranges. In this paper, we propose Adaptive Focus Framework (AF$_2$), which
adopts a hierarchical segmentation procedure and focuses on adaptively
utilizing multi-scale representations generated by widely adopted neural
network architectures. Particularly, a learnable module, called Adaptive
Confidence Mechanism (ACM), is proposed to determine which scale of
representation should be used for the segmentation of different objects.
Comprehensive experiments show that AF$_2$ has significantly improved the
accuracy on three widely used aerial benchmarks, as fast as the mainstream
method.
- Abstract(参考訳): 特定のセマンティックセグメンテーションタスクとして、空中画像セグメンテーションは高空間分解能(HSR)リモートセンシング画像理解に広く用いられている。
一般的なセマンティックセグメンテーションタスクが直面する一般的な問題(例えば大規模変動)に加えて、空中画像セグメンテーションにはいくつかの固有の課題があり、中でも最も重要なものは前景と背景のアンバランスにある。
情報的マルチスケールの特徴表現を抽出し、オブジェクト境界の識別を高めるために使用できるため、高度なニューラルネットワークアーキテクチャを提案することでこの問題に対処しようとする最近の取り組みがある。
それにもかかわらず、それらの多くは単にこれらのマルチスケール表現をアドホック測度で利用するだけであるが、様々な大きさの物体の意味が様々な範囲の受容的場を通してよりよく識別できるという事実を無視している。
本稿では,階層的セグメンテーション手法を採用し,広く採用されているニューラルネットワークアーキテクチャによって生成されたマルチスケール表現を適応的に活用するadaptive focus framework (af$_2$)を提案する。
特に,適応信頼機構 (Adaptive Confidence Mechanism, ACM) と呼ばれる学習可能なモジュールを提案する。
総合的な実験によると、AF$_2$は3つの広く使われている航空ベンチマークの精度を大幅に改善した。
関連論文リスト
- MROVSeg: Breaking the Resolution Curse of Vision-Language Models in Open-Vocabulary Semantic Segmentation [33.67313662538398]
オープン語彙セマンティックセマンティックセグメンテーションのためのマルチレゾリューション・トレーニング・フレームワークを提案する。
MROVSegはスライディングウィンドウを使用して高解像度の入力を均一なパッチにスライスし、それぞれがよく訓練されたイメージエンコーダの入力サイズと一致する。
オープン語彙セマンティックセグメンテーションベンチマークにおけるMROVSegの優位性を実証する。
論文 参考訳(メタデータ) (2024-08-27T04:45:53Z) - SSA-Seg: Semantic and Spatial Adaptive Pixel-level Classifier for Semantic Segmentation [11.176993272867396]
本稿ではセマンティック・空間適応(SSA-Seg)を提案し,セマンティックセグメンテーションの課題に対処する。
具体的には、固定されたプロトタイプから得られた粗いマスクを用いて、テスト画像のセマンティック領域と空間領域の中心に向けて固定されたプロトタイプを調整する。
その結果,提案したSSA-Segは,計算コストを最小限に抑えながら,ベースラインモデルのセグメンテーション性能を著しく向上させることがわかった。
論文 参考訳(メタデータ) (2024-05-10T15:14:23Z) - Rotated Multi-Scale Interaction Network for Referring Remote Sensing Image Segmentation [63.15257949821558]
Referring Remote Sensing Image (RRSIS)は、コンピュータビジョンと自然言語処理を組み合わせた新しい課題である。
従来の参照画像(RIS)アプローチは、空中画像に見られる複雑な空間スケールと向きによって妨げられている。
本稿ではRMSIN(Rotated Multi-Scale Interaction Network)を紹介する。
論文 参考訳(メタデータ) (2023-12-19T08:14:14Z) - Hi-ResNet: Edge Detail Enhancement for High-Resolution Remote Sensing Segmentation [10.919956120261539]
高分解能リモートセンシング(HRS)セマンティックセマンティクスは、高分解能カバレッジ領域からキーオブジェクトを抽出する。
HRS画像内の同じカテゴリのオブジェクトは、多様な地理的環境におけるスケールと形状の顕著な違いを示す。
効率的なネットワーク構造を持つ高分解能リモートセンシングネットワーク(Hi-ResNet)を提案する。
論文 参考訳(メタデータ) (2023-05-22T03:58:25Z) - Domain Adaptive Semantic Segmentation by Optimal Transport [13.133890240271308]
セマンティックシーンセグメンテーションは、それが含んでいるセマンティック情報の豊かさから、多くの注目を集めています。
現在のアプローチは主に畳み込みニューラルネットワーク(CNN)に基づいているが、多くのラベルに依存している。
本稿では、最適輸送(OT)とこの問題に対処するためのアテンションメカニズムに基づくドメイン適応(DA)フレームワークを提案する。
論文 参考訳(メタデータ) (2023-03-29T03:33:54Z) - Progressively Dual Prior Guided Few-shot Semantic Segmentation [57.37506990980975]
Few-shotのセマンティックセマンティックセマンティクスタスクは、いくつかのアノテーション付きサポートサンプルを使用して、クエリイメージのセマンティクスを実行することを目的としている。
本稿では,先進的に2重にガイドされた数発のセマンティックセマンティックセグメンテーションネットワークを提案する。
論文 参考訳(メタデータ) (2022-11-20T16:19:47Z) - Multi-Scale Multi-Target Domain Adaptation for Angle Closure
Classification [50.658613573816254]
角度閉包分類のためのM2DAN(Multi-scale Multi-target Domain Adversarial Network)を提案する。
異なるスケールでのこれらのドメイン不変性に基づいて、ソースドメインで訓練されたディープモデルは、複数のターゲットドメインの角度クロージャを分類することができる。
論文 参考訳(メタデータ) (2022-08-25T15:27:55Z) - Semantic Attention and Scale Complementary Network for Instance
Segmentation in Remote Sensing Images [54.08240004593062]
本稿では,セマンティックアテンション(SEA)モジュールとスケール補完マスクブランチ(SCMB)で構成される,エンドツーエンドのマルチカテゴリインスタンスセグメンテーションモデルを提案する。
SEAモジュールは、機能マップ上の興味あるインスタンスのアクティベーションを強化するために、追加の監督を備えた、単純な完全な畳み込みセマンティックセマンティックセマンティクスブランチを含んでいる。
SCMBは、元のシングルマスクブランチをトリデントマスクブランチに拡張し、異なるスケールで補完マスクの監視を導入する。
論文 参考訳(メタデータ) (2021-07-25T08:53:59Z) - Multi Receptive Field Network for Semantic Segmentation [8.06045579589765]
セグメンテーションのためのMRFM(Multi-Receptive Field Module)を提案する。
また、オブジェクト/スタッフの境界を識別するのに有効なエッジ認識損失を設計する。
具体的には、Cityscapesデータセットで83.0の平均IoU、Pascal VOC2012データセットで88.4の平均IoUを達成する。
論文 参考訳(メタデータ) (2020-11-17T11:52:23Z) - Affinity Space Adaptation for Semantic Segmentation Across Domains [57.31113934195595]
本稿では,意味的セグメンテーションにおける教師なしドメイン適応(UDA)の問題に対処する。
ソースドメインとターゲットドメインが不変なセマンティック構造を持つという事実に触発され、ドメイン間におけるそのような不変性を活用することを提案する。
親和性空間適応戦略として,親和性空間の洗浄と親和性空間アライメントという2つの方法を開発した。
論文 参考訳(メタデータ) (2020-09-26T10:28:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。