論文の概要: SA-MixNet: Structure-aware Mixup and Invariance Learning for
Scribble-supervised Road Extraction in Remote Sensing Images
- arxiv url: http://arxiv.org/abs/2403.01381v1
- Date: Sun, 3 Mar 2024 02:56:43 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-06 21:46:37.259049
- Title: SA-MixNet: Structure-aware Mixup and Invariance Learning for
Scribble-supervised Road Extraction in Remote Sensing Images
- Title(参考訳): SA-MixNet:リモートセンシング画像におけるスクリブル制御道路抽出のための構造認識混合と不変学習
- Authors: Jie Feng, Hao Huang, Junpeng Zhang, Weisheng Dong, Dingwen Zhang,
Licheng Jiao
- Abstract要約: 複雑化の進んだ画像シーンを作成するために,ある画像から別の画像へ道路領域を貼り付ける構造を意識したミックスアップ方式を提案する。
道路構造を保ちながら接続性を高めるために,識別器に基づく正規化が設計されている。
われわれのフレームワークは、DeepGlobe、Wuhan、およびマサチューセッツのデータセット上で優れたパフォーマンスを示している。
- 参考スコア(独自算出の注目度): 85.52629779976137
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Mainstreamed weakly supervised road extractors rely on highly confident
pseudo-labels propagated from scribbles, and their performance often degrades
gradually as the image scenes tend various. We argue that such degradation is
due to the poor model's invariance to scenes with different complexities,
whereas existing solutions to this problem are commonly based on crafted priors
that cannot be derived from scribbles. To eliminate the reliance on such
priors, we propose a novel Structure-aware Mixup and Invariance Learning
framework (SA-MixNet) for weakly supervised road extraction that improves the
model invariance in a data-driven manner. Specifically, we design a
structure-aware Mixup scheme to paste road regions from one image onto another
for creating an image scene with increased complexity while preserving the
road's structural integrity. Then an invariance regularization is imposed on
the predictions of constructed and origin images to minimize their conflicts,
which thus forces the model to behave consistently on various scenes. Moreover,
a discriminator-based regularization is designed for enhancing the connectivity
meanwhile preserving the structure of roads. Combining these designs, our
framework demonstrates superior performance on the DeepGlobe, Wuhan, and
Massachusetts datasets outperforming the state-of-the-art techniques by 1.47%,
2.12%, 4.09% respectively in IoU metrics, and showing its potential of
plug-and-play. The code will be made publicly available.
- Abstract(参考訳): 主流の弱い道路抽出機は、スクリブルから伝播する自信の強い擬似ラベルに依存しており、画像シーンが多様になるにつれて、その性能は徐々に低下する。
このような劣化は、異なる複雑さを持つシーンに対するモデルの不均一性に起因すると論じる一方で、既存の解は、スクリブルから導出できない工芸品の先行に基づくのが一般的である。
そこで本研究では,データ駆動方式のモデル不変性を改善するために,弱教師付き道路抽出のための構造認識型混和・不分散学習フレームワーク(sa-mixnet)を提案する。
具体的には,道路の構造的完全性を維持しつつ,複雑な画像シーンを作成するために,道路領域を画像から別の画像に貼り付ける構造認識ミックスアップスキームを設計する。
次に、構築された画像と原点画像の予測に分散正規化を課し、衝突を最小限に抑え、モデルが様々な場面で一貫して振る舞うことを強いる。
さらに,道路構造を保全しつつ接続性を高めるために,識別器に基づく正規化を設計する。
これらの設計を組み合わせることで、私たちのフレームワークは、DeepGlobe、Wuhan、およびマサチューセッツのデータセットにおいて、IoUメトリクスのそれぞれ1.47%、2.12%、4.09%の最先端技術よりも優れたパフォーマンスを示し、プラグアンドプレイの可能性を示している。
コードは公開される予定だ。
関連論文リスト
- Adapting Diffusion Models for Improved Prompt Compliance and Controllable Image Synthesis [43.481539150288434]
この作品は新しい家族を紹介します。
因子グラフ拡散モデル(FG-DM)
FG-DMは結合分布をモデル化する。
イメージやコンディショニング変数、例えばセマンティック、スケッチなどです。
因子グラフ分解による 奥行きや正常な地図です
論文 参考訳(メタデータ) (2024-10-29T00:54:00Z) - Distance Weighted Trans Network for Image Completion [52.318730994423106]
本稿では,DWT(Distance-based Weighted Transformer)を利用した画像コンポーネント間の関係をよりよく理解するためのアーキテクチャを提案する。
CNNは、粗い事前の局所的なテクスチャ情報を強化するために使用される。
DWTブロックは、特定の粗いテクスチャやコヒーレントな視覚構造を復元するために使用される。
論文 参考訳(メタデータ) (2023-10-11T12:46:11Z) - Searching a Compact Architecture for Robust Multi-Exposure Image Fusion [55.37210629454589]
2つの大きなスタブリングブロックは、画素の不一致や非効率な推論など、開発を妨げる。
本研究では,高機能なマルチ露光画像融合のための自己アライメントとディテールリプレクションモジュールを取り入れたアーキテクチャ検索に基づくパラダイムを提案する。
提案手法は様々な競争方式より優れており、一般的なシナリオではPSNRが3.19%向上し、不整合シナリオでは23.5%向上した。
論文 参考訳(メタデータ) (2023-05-20T17:01:52Z) - RISP: Rendering-Invariant State Predictor with Differentiable Simulation
and Rendering for Cross-Domain Parameter Estimation [110.4255414234771]
既存のソリューションでは、大量のトレーニングデータが必要か、未知のレンダリング設定への一般化性が欠如している。
本稿では、ドメインのランダム化と微分可能なレンダリング勾配を併用してこの問題に対処する手法を提案する。
提案手法は, 再構成誤差を大幅に低減し, 未知のレンダリング構成間の一般化性が向上する。
論文 参考訳(メタデータ) (2022-05-11T17:59:51Z) - Encoding Robustness to Image Style via Adversarial Feature Perturbations [72.81911076841408]
我々は、画像画素ではなく特徴統計を直接摂動することで、頑健なモデルを生成することで、敵の訓練に適応する。
提案手法であるAdvBN(Adversarial Batch Normalization)は,トレーニング中に最悪の機能摂動を発生させる単一ネットワーク層である。
論文 参考訳(メタデータ) (2020-09-18T17:52:34Z) - Image Fine-grained Inpainting [89.17316318927621]
拡張畳み込みの密結合を利用してより大きく効果的な受容場を得る一段階モデルを提案する。
この効率的なジェネレータをよく訓練するために、頻繁に使用されるVGG特徴整合損失を除いて、新しい自己誘導回帰損失を設計する。
また、局所的・グローバルな分枝を持つ識別器を用いて、局所的・グローバルな内容の整合性を確保する。
論文 参考訳(メタデータ) (2020-02-07T03:45:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。