論文の概要: Generic Knowledge Boosted Pre-training For Remote Sensing Images
- arxiv url: http://arxiv.org/abs/2401.04614v1
- Date: Tue, 9 Jan 2024 15:36:07 GMT
- ステータス: 処理完了
- システム内更新日: 2024-01-10 15:22:53.617913
- Title: Generic Knowledge Boosted Pre-training For Remote Sensing Images
- Title(参考訳): リモートセンシング画像のための汎用知識強化事前学習
- Authors: Ziyue Huang, Mingming Zhang, Yuan Gong, Qingjie Liu, Yunhong Wang
- Abstract要約: Generic Knowledge Boosted Remote Sensing Pre-training (GeRSP)は、新しいリモートセンシング事前トレーニングフレームワークである。
GeRSPは、リモートセンシング理解タスクのために、リモートセンシングと自然なイメージから堅牢な表現を学ぶ。
本稿では,GeRSPが効果的にロバスト表現を統一的に学習できることを示し,リモートセンシングダウンストリームタスクの性能を向上させる。
- 参考スコア(独自算出の注目度): 46.071496675604884
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Deep learning models are essential for scene classification, change
detection, land cover segmentation, and other remote sensing image
understanding tasks. Most backbones of existing remote sensing deep learning
models are typically initialized by pre-trained weights obtained from ImageNet
pre-training (IMP). However, domain gaps exist between remote sensing images
and natural images (e.g., ImageNet), making deep learning models initialized by
pre-trained weights of IMP perform poorly for remote sensing image
understanding. Although some pre-training methods are studied in the remote
sensing community, current remote sensing pre-training methods face the problem
of vague generalization by only using remote sensing images. In this paper, we
propose a novel remote sensing pre-training framework, Generic Knowledge
Boosted Remote Sensing Pre-training (GeRSP), to learn robust representations
from remote sensing and natural images for remote sensing understanding tasks.
GeRSP contains two pre-training branches: (1) A self-supervised pre-training
branch is adopted to learn domain-related representations from unlabeled remote
sensing images. (2) A supervised pre-training branch is integrated into GeRSP
for general knowledge learning from labeled natural images. Moreover, GeRSP
combines two pre-training branches using a teacher-student architecture to
simultaneously learn representations with general and special knowledge, which
generates a powerful pre-trained model for deep learning model initialization.
Finally, we evaluate GeRSP and other remote sensing pre-training methods on
three downstream tasks, i.e., object detection, semantic segmentation, and
scene classification. The extensive experimental results consistently
demonstrate that GeRSP can effectively learn robust representations in a
unified manner, improving the performance of remote sensing downstream tasks.
- Abstract(参考訳): 深層学習モデルは、シーン分類、変化検出、ランドカバーセグメンテーション、その他のリモートセンシング画像理解タスクに不可欠である。
既存のリモートセンシングディープラーニングモデルのバックボーンのほとんどは、imagenet pre-training(imp)から得られた事前学習重みによって初期化される。
しかし、リモートセンシング画像と自然画像(例えば、ImageNet)の間にドメインギャップがあり、IMPの事前学習重量で初期化されるディープラーニングモデルは、リモートセンシング画像理解には不十分である。
リモートセンシングコミュニティにおいて,いくつかの事前学習法が研究されているが,現在のリモートセンシング事前学習法は,リモートセンシング画像のみを用いて,曖昧な一般化の問題に直面している。
本稿では,リモートセンシング前学習フレームワークであるgeneric knowledge boosted remote sensing pre-training (gersp)を提案する。
GeRSPには2つの事前学習ブランチがある: 1) ラベルのないリモートセンシング画像からドメイン関連表現を学習するために、自己教師付き事前学習ブランチが採用されている。
2)ラベル付き自然画像から一般知識学習のための教師付き事前学習ブランチをgerspに統合する。
さらに、GeRSPは教師学生アーキテクチャを用いて2つの事前学習ブランチを組み合わせて、表現を一般知識と特殊知識で同時に学習し、深層学習モデル初期化のための強力な事前学習モデルを生成する。
最後に,対象検出,意味セグメンテーション,シーン分類という3つの下流タスクにおいて,gerspや他のリモートセンシング事前学習手法を評価する。
広範にわたる実験結果から,GeRSPは一貫した方法で頑健な表現を効果的に学習し,リモートセンシングによる下流タスクの性能向上を図っている。
関連論文リスト
- Pattern Integration and Enhancement Vision Transformer for Self-Supervised Learning in Remote Sensing [11.626527403157922]
本稿では、リモートセンシング画像のための新しい自己教師型学習フレームワークであるPattern Integration and Enhancement Vision Transformer(PIEViT)を紹介する。
PIEViTは内部パッチ機能の表現を強化し、既存の自己管理ベースラインよりも大幅に改善されている。
オブジェクト検出、土地被覆分類、変更検出において優れた結果が得られ、リモートセンシング画像解釈タスクの堅牢性、一般化、転送性などが評価される。
論文 参考訳(メタデータ) (2024-11-09T07:06:31Z) - Rethinking Feature Backbone Fine-tuning for Remote Sensing Object Detection [10.896464615994494]
リモートセンシングオブジェクト検出における機能バックボーン微細調整のためのDBF(Dynamic Backbone Freezing)を提案する。
本手法は,背骨が低レベルなジェネリック特徴を引き出すべきか,あるいはリモートセンシング領域の特定の知識を持つべきか,というジレンマを扱うことを目的としている。
提案手法は,計算コストを大幅に削減しつつ,より正確なモデル学習を可能にする。
論文 参考訳(メタデータ) (2024-07-21T12:32:00Z) - Remote Sensing Vision-Language Foundation Models without Annotations via
Ground Remote Alignment [61.769441954135246]
テキストアノテーションを使わずにリモートセンシング画像の視覚言語モデルを訓練する手法を提案する。
私たちの重要な洞察は、リモートセンシング画像と言語を接続するための仲介手段として、地上で撮影されたコロケーションのインターネットイメージを使用することです。
論文 参考訳(メタデータ) (2023-12-12T03:39:07Z) - An Empirical Study of Remote Sensing Pretraining [117.90699699469639]
本研究では,空中画像におけるリモートセンシング事前訓練(RSP)の実証的研究を行った。
RSPは、シーン認識タスクで特有のパフォーマンスを提供するのに役立つ。
RSPは、従来のイメージネットがRS画像に事前学習する際のデータ格差を緩和するが、それでもタスクの相違に悩まされる可能性がある。
論文 参考訳(メタデータ) (2022-04-06T13:38:11Z) - Semantic-Aware Generation for Self-Supervised Visual Representation
Learning [116.5814634936371]
セマンティック・アウェア・ジェネレーション(SaGe)は、生成した画像に保存される詳細よりも、よりリッチなセマンティクスを促進する。
SaGeは、ターゲットネットワークをビュー特有の特徴で補完することで、集中的なデータ拡張によって引き起こされるセマンティックな劣化を軽減する。
我々は、ImageNet-1K上でSaGeを実行し、近接検定、線形分類、微視的画像認識を含む5つの下流タスクで事前訓練されたモデルを評価する。
論文 参考訳(メタデータ) (2021-11-25T16:46:13Z) - Geographical Knowledge-driven Representation Learning for Remote Sensing
Images [18.79154074365997]
リモートセンシング画像のための地理知識駆動表現学習法(GeoKR)を提案する。
各リモートセンシング画像に関連するグローバルな土地被覆製品と地理的位置を地理的知識とみなす。
ネットワーク事前トレーニングをサポートするために,大規模な事前トレーニングデータセットであるLevir-KRを提案する。
論文 参考訳(メタデータ) (2021-07-12T09:23:15Z) - Self-Supervised Learning of Remote Sensing Scene Representations Using
Contrastive Multiview Coding [0.0]
遠隔センシング画像分類における自己監督学習の適用可能性の分析を行う。
遠隔センシング画像分類の下流課題において,自己教師付き事前学習は自然シーン画像の教師付き事前学習よりも優れた結果が得られることを示す。
論文 参考訳(メタデータ) (2021-04-14T18:25:43Z) - Seasonal Contrast: Unsupervised Pre-Training from Uncurated Remote
Sensing Data [64.40187171234838]
季節的コントラスト(SeCo)は、リモートセンシング表現のドメイン内事前トレーニングにラベルのないデータを活用するための効果的なパイプラインである。
SeCoは、転送学習を容易にし、再リモートセンシングアプリケーションの急速な進歩を可能にするために公開されます。
論文 参考訳(メタデータ) (2021-03-30T18:26:39Z) - Remote Sensing Image Scene Classification Meets Deep Learning:
Challenges, Methods, Benchmarks, and Opportunities [81.29441139530844]
本稿では,160以上の論文を網羅し,リモートセンシング画像シーン分類のためのディープラーニング手法の体系的調査を行う。
リモートセンシング画像シーンの分類と調査の主な課題について論じる。
リモートセンシング画像シーン分類に使用されるベンチマークを導入し,2ダース以上の代表アルゴリズムの性能を要約する。
論文 参考訳(メタデータ) (2020-05-03T14:18:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。