論文の概要: Semantic-aware Dense Representation Learning for Remote Sensing Image
Change Detection
- arxiv url: http://arxiv.org/abs/2205.13769v1
- Date: Fri, 27 May 2022 06:08:33 GMT
- ステータス: 処理完了
- システム内更新日: 2022-05-30 14:57:58.545511
- Title: Semantic-aware Dense Representation Learning for Remote Sensing Image
Change Detection
- Title(参考訳): リモートセンシング画像変化検出のためのsemantic-aware dense representation learning
- Authors: Hao Chen, Wenyuan Li, Song Chen and Zhenwei Shi
- Abstract要約: ディープラーニングに基づく変化検出モデルのトレーニングはラベル付きデータに大きく依存する。
最近のトレンドは、リモートセンシング(RS)データを使用して、教師付きまたは自己教師型学習(SSL)を通じてドメイン内表現を取得することである。
複数のクラスバランス点をサンプリングし,RS画像CDに対する意味認識事前学習を提案する。
- 参考スコア(独自算出の注目度): 20.761672725633936
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Training deep learning-based change detection (CD) model heavily depends on
labeled data. Contemporary transfer learning-based methods to alleviate the CD
label insufficiency mainly upon ImageNet pre-training. A recent trend is using
remote sensing (RS) data to obtain in-domain representations via supervised or
self-supervised learning (SSL). Here, different from traditional supervised
pre-training that learns the mapping from image to label, we leverage semantic
supervision in a contrastive manner. There are typically multiple objects of
interest (e.g., buildings) distributed in varying locations in RS images. We
propose dense semantic-aware pre-training for RS image CD via sampling multiple
class-balanced points. Instead of manipulating image-level representations that
lack spatial information, we constrain pixel-level cross-view consistency and
cross-semantic discrimination to learn spatially-sensitive features, thus
benefiting downstream dense CD. Apart from learning illumination invariant
features, we fulfill consistent foreground features insensitive to irrelevant
background changes via a synthetic view using background swapping. We
additionally achieve discriminative representations to distinguish foreground
land-covers and others. We collect large-scale image-mask pairs freely
available in the RS community for pre-training. Extensive experiments on three
CD datasets verify the effectiveness of our method. Ours significantly
outperforms ImageNet, in-domain supervision, and several SSL methods. Empirical
results indicate ours well alleviates data insufficiency in CD. Notably, we
achieve competitive results using only 20% training data than baseline (random)
using 100% data. Both quantitative and qualitative results demonstrate the
generalization ability of our pre-trained model to downstream images even
remaining domain gaps with the pre-training data. Our Code will make public.
- Abstract(参考訳): ディープラーニングに基づく変化検出(CD)モデルのトレーニングはラベル付きデータに大きく依存する。
コンテンポラリートランスファー学習に基づくCDラベル不足の軽減手法 : ImageNet事前学習を中心に
最近のトレンドは、リモートセンシング(RS)データを使用して、教師付きまたは自己教師型学習(SSL)を通じて、ドメイン内の表現を取得することである。
ここでは,画像からラベルへのマッピングを学習する従来の教師付き事前学習とは異なり,意味的監督を対比的に活用する。
通常、RS画像の様々な場所に複数の関心の対象(例えば、建物)が分散している。
複数のクラスバランス点をサンプリングし,RS画像CDに対する意味認識事前学習を提案する。
空間情報を欠いた画像レベルの表現を操作する代わりに、画素レベルの横断的一貫性と横断的識別を制約し、空間感性のある特徴を学習し、下流の高密度CDの恩恵を受ける。
照度不変特徴の学習とは別に,背景スワッピングを用いた合成ビューを通じて,無関係な背景変化に影響を受けない一貫したフォアグラウンド特徴を実現する。
また,前景の土地被覆等を識別するための識別表現も行う。
我々は,rsコミュニティで自由に利用可能な大規模画像マスクペアを事前学習のために収集する。
3つのCDデータセットの大規模な実験により,本手法の有効性が検証された。
ImageNet、ドメイン内の監視、SSLメソッドよりも優れています。
実験の結果,CDにおけるデータ不足は良好に軽減された。
特に、100%データを用いたベースライン(ランダム)よりも20%のトレーニングデータで競合する結果が得られる。
定量的および定性的な結果から,事前学習データに残されている領域ギャップでさえも,学習済みモデルの下流画像への一般化能を示す。
私たちのコードは公開します。
関連論文リスト
- CricaVPR: Cross-image Correlation-aware Representation Learning for Visual Place Recognition [73.51329037954866]
視覚的位置認識のための画像間相関認識を用いたロバストなグローバル表現手法を提案する。
本手法では,バッチ内の複数の画像の相関にアテンション機構を用いる。
本手法は,訓練時間を大幅に短縮し,最先端の手法よりも優れた性能を示す。
論文 参考訳(メタデータ) (2024-02-29T15:05:11Z) - Deep Semantic-Visual Alignment for Zero-Shot Remote Sensing Image Scene
Classification [26.340737217001497]
ゼロショット学習(ZSL)は、トレーニング中に見えない新しいクラスを識別する。
以前のZSLモデルは、主に言語モデルから抽出された手作業でラベル付けされた属性や単語の埋め込みに依存し、見受けられるクラスから新しいクラスに知識を伝達する。
本稿では,視覚的に検出可能な属性を自動的に収集することを提案する。属性と画像のセマンティック・視覚的類似性を記述することで,クラスごとの属性を予測する。
論文 参考訳(メタデータ) (2024-02-03T09:18:49Z) - Fine-grained Recognition with Learnable Semantic Data Augmentation [68.48892326854494]
きめ細かい画像認識は、長年続くコンピュータビジョンの課題である。
本稿では,識別領域損失問題を軽減するため,特徴レベルのトレーニングデータを多様化することを提案する。
本手法は,いくつかの人気分類ネットワーク上での一般化性能を著しく向上させる。
論文 参考訳(メタデータ) (2023-09-01T11:15:50Z) - CSP: Self-Supervised Contrastive Spatial Pre-Training for
Geospatial-Visual Representations [90.50864830038202]
ジオタグ付き画像の自己教師型学習フレームワークであるContrastive Spatial Pre-Training(CSP)を提案する。
デュアルエンコーダを用いて画像とその対応する位置情報を別々に符号化し、コントラスト目的を用いて画像から効果的な位置表現を学習する。
CSPは、様々なラベル付きトレーニングデータサンプリング比と10~34%の相対的な改善で、モデル性能を大幅に向上させる。
論文 参考訳(メタデータ) (2023-05-01T23:11:18Z) - Self-Supervised In-Domain Representation Learning for Remote Sensing
Image Scene Classification [1.0152838128195465]
ImageNetのトレーニング済み重量を様々なリモートセンシングタスクに転送すると、許容できる結果が得られる。
近年の研究では、自己教師あり学習手法が、より差別的で伝達しやすい視覚的特徴を捉えていることが示されている。
我々はこれらの事実に動機付けられ、対照的な自己教師付き学習を用いて、リモートセンシング画像のドメイン内表現を事前訓練する。
論文 参考訳(メタデータ) (2023-02-03T15:03:07Z) - Semantic decoupled representation learning for remote sensing image
change detection [17.548248093344576]
RS画像CDのセマンティックデカップリング表現学習を提案する。
我々は、セマンティックマスクを利用して、異なるセマンティック領域の表現をアンタングルする。
さらに、下流CDタスクにおける関心対象の認識に役立ち、異なる意味表現を区別するようモデルに強制する。
論文 参考訳(メタデータ) (2022-01-15T07:35:26Z) - AugNet: End-to-End Unsupervised Visual Representation Learning with
Image Augmentation [3.6790362352712873]
我々は、未ラベル画像の集合から画像特徴を学習するための新しいディープラーニングトレーニングパラダイムであるAugNetを提案する。
実験により,低次元空間における画像の表現が可能であることを実証した。
多くのディープラーニングベースの画像検索アルゴリズムとは異なり、我々のアプローチは外部アノテーション付きデータセットへのアクセスを必要としない。
論文 参考訳(メタデータ) (2021-06-11T09:02:30Z) - Seasonal Contrast: Unsupervised Pre-Training from Uncurated Remote
Sensing Data [64.40187171234838]
季節的コントラスト(SeCo)は、リモートセンシング表現のドメイン内事前トレーニングにラベルのないデータを活用するための効果的なパイプラインである。
SeCoは、転送学習を容易にし、再リモートセンシングアプリケーションの急速な進歩を可能にするために公開されます。
論文 参考訳(メタデータ) (2021-03-30T18:26:39Z) - Remote Sensing Image Scene Classification with Self-Supervised Paradigm
under Limited Labeled Samples [11.025191332244919]
我々は,大規模なラベル付きデータからRSIシーン分類のための高性能事前学習モデルを得るために,新たな自己教師付き学習(SSL)機構を導入する。
一般的な3つのRSIシーン分類データセットの実験により、この新たな学習パラダイムは、従来の支配的なImageNet事前学習モデルよりも優れていることが示された。
我々の研究から得られた知見は、リモートセンシングコミュニティにおけるSSLの発展を促進するのに役立ちます。
論文 参考訳(メタデータ) (2020-10-02T09:27:19Z) - Gradient-Induced Co-Saliency Detection [81.54194063218216]
Co-SOD(Co-saliency Detection)は、一般的な唾液前景を関連画像のグループに分割することを目的としている。
本稿では,人間の行動にインスパイアされた,勾配誘導型共分散検出法を提案する。
論文 参考訳(メタデータ) (2020-04-28T08:40:55Z) - Distilling Localization for Self-Supervised Representation Learning [82.79808902674282]
コントラスト学習は教師なし表現学習に革命をもたらした。
現在のコントラストモデルでは、前景オブジェクトのローカライズには効果がない。
本稿では,背景変化を学習するためのデータ駆動型手法を提案する。
論文 参考訳(メタデータ) (2020-04-14T16:29:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。