論文の概要: Adversarial Loss for Semantic Segmentation of Aerial Imagery
- arxiv url: http://arxiv.org/abs/2001.04269v2
- Date: Sat, 18 Jan 2020 10:21:37 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-11 23:44:14.891097
- Title: Adversarial Loss for Semantic Segmentation of Aerial Imagery
- Title(参考訳): 航空画像のセマンティックセグメンテーションにおける逆損失
- Authors: Clint Sebastian, Raffaele Imbriaco, Egor Bondarev, Peter H.N. de With
- Abstract要約: 本稿では,意味的セグメンテーションにおける局所的・グローバル的文脈の理解を学習する新たな損失関数を提案する。
DeepLab v3+ネットワークに新たに提案された損失関数は、マサチューセッツの建物データセットの最先端結果を取得する。
- 参考スコア(独自算出の注目度): 12.241693880896348
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Automatic building extraction from aerial imagery has several applications in
urban planning, disaster management, and change detection. In recent years,
several works have adopted deep convolutional neural networks (CNNs) for
building extraction, since they produce rich features that are invariant
against lighting conditions, shadows, etc. Although several advances have been
made, building extraction from aerial imagery still presents multiple
challenges. Most of the deep learning segmentation methods optimize the
per-pixel loss with respect to the ground truth without knowledge of the
context. This often leads to imperfect outputs that may lead to missing or
unrefined regions. In this work, we propose a novel loss function combining
both adversarial and cross-entropy losses that learn to understand both local
and global contexts for semantic segmentation. The newly proposed loss function
deployed on the DeepLab v3+ network obtains state-of-the-art results on the
Massachusetts buildings dataset. The loss function improves the structure and
refines the edges of buildings without requiring any of the commonly used
post-processing methods, such as Conditional Random Fields. We also perform
ablation studies to understand the impact of the adversarial loss. Finally, the
proposed method achieves a relaxed F1 score of 95.59% on the Massachusetts
buildings dataset compared to the previous best F1 of 94.88%.
- Abstract(参考訳): 航空画像からの建物の自動抽出は、都市計画、災害管理、変化検出にいくつかの応用がある。
近年では、照明条件や影などに対して不変な豊富な特徴を生んでいるため、建物抽出に深層畳み込みニューラルネットワーク(CNN)が採用されている。
幾度かの進歩があったが、航空画像からの建築物の抽出は依然として多くの課題を呈している。
深層学習のセグメンテーション手法の多くは、文脈の知識のない基礎的な真実に関して、ピクセル当たりの損失を最適化する。
これはしばしば不完全な出力をもたらし、不足または未精製領域につながる可能性がある。
本研究では,意味セグメンテーションのための局所的および大域的な文脈を理解することを学ぶ,逆的および相互エントロピー的損失を組み合わせる新しい損失関数を提案する。
新たに提案されたdeeplab v3+ネットワーク上の損失関数は、マサチューセッツビルディングデータセットの最先端の結果を得る。
損失関数は構造を改善し、コンディショナルランダムフィールドのような一般的な後処理手法を必要とせずに建物の縁を洗練させる。
また, 敵の損失が与える影響を理解するため, アブレーション研究を行う。
最後に、提案手法はマサチューセッツの建物のデータセットで95.59%の緩和されたF1スコアを達成する。
関連論文リスト
- Deep Loss Convexification for Learning Iterative Models [11.36644967267829]
点雲登録のための反復的最近点(ICP)のような反復的手法は、しばしば悪い局所最適性に悩まされる。
我々は,各地真実の周囲に凸景観を形成する学習を提案する。
論文 参考訳(メタデータ) (2024-11-16T01:13:04Z) - DiAD: A Diffusion-based Framework for Multi-class Anomaly Detection [55.48770333927732]
本稿では,拡散型異常検出(Difusion-based Anomaly Detection, DAD)フレームワークを提案する。
画素空間オートエンコーダ、安定拡散の復調ネットワークに接続する潜在空間セマンティックガイド(SG)ネットワーク、特徴空間事前学習機能抽出器から構成される。
MVTec-ADとVisAデータセットの実験は、我々のアプローチの有効性を実証している。
論文 参考訳(メタデータ) (2023-12-11T18:38:28Z) - AugUndo: Scaling Up Augmentations for Monocular Depth Completion and Estimation [51.143540967290114]
本研究では,教師なし深度計算と推定のために,従来不可能であった幾何拡張の幅広い範囲をアンロックする手法を提案する。
これは、出力深さの座標への幾何変換を反転、あるいはアンドウイング(undo''-ing)し、深度マップを元の参照フレームに戻すことで達成される。
論文 参考訳(メタデータ) (2023-10-15T05:15:45Z) - Magic ELF: Image Deraining Meets Association Learning and Transformer [63.761812092934576]
本稿では,CNN と Transformer を統合化して,画像デライニングにおける学習のメリットを活用することを目的とする。
降雨除去と背景復旧を関連づける新しいマルチインプット・アテンション・モジュール (MAM) を提案する。
提案手法(ELF)は,最先端手法(MPRNet)を平均0.25dB向上させる。
論文 参考訳(メタデータ) (2022-07-21T12:50:54Z) - A Contrastive Distillation Approach for Incremental Semantic
Segmentation in Aerial Images [15.75291664088815]
現在のディープニューラルアーキテクチャに関する大きな問題は、破滅的な忘れこととして知られている。
我々は、任意の入力を拡張バージョンと比較する、対照的な正則化を提案する。
私たちは、Potsdamデータセットにおけるソリューションの有効性を示し、各テストにおけるインクリメンタルベースラインよりも優れています。
論文 参考訳(メタデータ) (2021-12-07T16:44:45Z) - Generic Perceptual Loss for Modeling Structured Output Dependencies [78.59700528239141]
トレーニングされた重みではなく、ネットワーク構造が重要であることを示す。
我々は、出力の構造化依存関係をモデル化するためにランダムに重み付けされたディープcnnが使用できることを実証する。
論文 参考訳(メタデータ) (2021-03-18T23:56:07Z) - Road Segmentation for Remote Sensing Images using Adversarial Spatial
Pyramid Networks [28.32775611169636]
合成画像生成と道路分割に構造化領域適応を適用した新しいモデルを提案する。
マルチレベルの特徴マップから学び、特徴のセマンティクスを改善するために、新しいスケールワイズアーキテクチャが導入された。
我々のモデルは、14.89Mパラメータと86.78B FLOPを持つマサチューセッツのデータセット上で、最先端の78.86 IOUを達成し、4倍少ないFLOPを持つが、より高精度(+3.47% IOU)である。
論文 参考訳(メタデータ) (2020-08-10T11:00:19Z) - RescueNet: Joint Building Segmentation and Damage Assessment from
Satellite Imagery [83.49145695899388]
RescueNetは、建物を同時に分割し、個々の建物に対する損傷レベルを評価し、エンドツーエンドでトレーニングできる統一モデルである。
RescueNetは大規模で多様なxBDデータセットでテストされており、従来の手法よりもはるかに優れたセグメンテーションと損傷分類性能を実現している。
論文 参考訳(メタデータ) (2020-04-15T19:52:09Z) - Contextual Pyramid Attention Network for Building Segmentation in Aerial
Imagery [12.241693880896348]
航空画像からの抽出は、都市計画、変更検出、災害管理といった問題にいくつかの応用がある。
コンテキストピラミッドアテンション(CPA)を用いた長距離依存関係のキャプチャにより,異なるサイズのセグメンテーションを改善することを提案する。
提案手法は,現在の最先端手法よりも1.8点,既存のベースラインよりも12.6点高い1.8点を後処理なしで改善する。
論文 参考訳(メタデータ) (2020-04-15T11:36:26Z) - Image Fine-grained Inpainting [89.17316318927621]
拡張畳み込みの密結合を利用してより大きく効果的な受容場を得る一段階モデルを提案する。
この効率的なジェネレータをよく訓練するために、頻繁に使用されるVGG特徴整合損失を除いて、新しい自己誘導回帰損失を設計する。
また、局所的・グローバルな分枝を持つ識別器を用いて、局所的・グローバルな内容の整合性を確保する。
論文 参考訳(メタデータ) (2020-02-07T03:45:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。