論文の概要: Self-Supervised Learning for Invariant Representations from
Multi-Spectral and SAR Images
- arxiv url: http://arxiv.org/abs/2205.02049v1
- Date: Wed, 4 May 2022 13:16:48 GMT
- ステータス: 処理完了
- システム内更新日: 2022-05-05 14:53:23.183848
- Title: Self-Supervised Learning for Invariant Representations from
Multi-Spectral and SAR Images
- Title(参考訳): 多スペクトル・SAR画像からの不変表現に対する自己教師付き学習
- Authors: Pallavi Jain, Bianca Schoen-Phelan, Robert Ross
- Abstract要約: 自己監視学習(SSL)は、いくつかのドメイン分類とセグメンテーションタスクにおいて、新しい最先端技術となっている。
本研究は, リモートセンシング(RS)領域に蒸留ネットワーク(BYOL)を適用したRSDnetを提案する。
- 参考スコア(独自算出の注目度): 5.994412766684843
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Self-Supervised learning (SSL) has become the new state-of-art in several
domain classification and segmentation tasks. Of these, one popular category in
SSL is distillation networks such as BYOL. This work proposes RSDnet, which
applies the distillation network (BYOL) in the remote sensing (RS) domain where
data is non-trivially different from natural RGB images. Since Multi-spectral
(MS) and synthetic aperture radar (SAR) sensors provide varied spectral and
spatial resolution information, we utilised them as an implicit augmentation to
learn invariant feature embeddings. In order to learn RS based invariant
features with SSL, we trained RSDnet in two ways, i.e., single channel feature
learning and three channel feature learning. This work explores the usefulness
of single channel feature learning from random MS and SAR bands compared to the
common notion of using three or more bands. In our linear evaluation, these
single channel features reached a 0.92 F1 score on the EuroSAT classification
task and 59.6 mIoU on the DFC segmentation task for certain single bands. We
also compared our results with ImageNet weights and showed that the RS based
SSL model outperforms the supervised ImageNet based model. We further explored
the usefulness of multi-modal data compared to single modality data, and it is
shown that utilising MS and SAR data learn better invariant representations
than utilising only MS data.
- Abstract(参考訳): 自己監視学習(SSL)は、いくつかのドメイン分類とセグメンテーションタスクにおいて新しい最先端技術となっている。
このうち、SSLの一般的なカテゴリはBYOLのような蒸留ネットワークである。
本研究では,自然のRGB画像と非自明に異なるリモートセンシング(RS)領域において,蒸留ネットワーク(BYOL)を適用したRSDnetを提案する。
マルチスペクトル (MS) と合成開口レーダ (SAR) センサは様々なスペクトルおよび空間分解能情報を提供するため, 不変な特徴埋め込みを学習するための暗黙拡張として利用した。
sslでrsベースの不変機能を学ぶために、rsdnetを2つの方法、すなわち単一チャネル特徴学習と3つのチャネル特徴学習で訓練した。
本研究は、ランダムMSおよびSARバンドからの単一チャネル特徴学習の有用性について、3つ以上のバンドを使用するという一般的な概念と比較した。
線形評価では,これらの単一チャネルはEuroSAT分類タスクで0.92F1、DFC分割タスクで59.6mIoUに達した。
また、この結果とImageNet重みを比較し、RSベースのSSLモデルは教師付きImageNetベースモデルよりも優れていることを示した。
さらに,マルチモーダルデータの有用性を単一モーダルデータと比較し,MSデータとSARデータを併用することで,MSデータとSARデータを併用するよりも優れた不変表現を学習できることを示した。
関連論文リスト
- Adapting Segment Anything Model for Change Detection in HR Remote
Sensing Images [18.371087310792287]
本研究は、高解像度リモートセンシング画像(RSI)の変化検出を改善するために、ビジョンファウンデーションモデル(VFM)の強力な視覚認識機能を活用することを目的とする。
我々は、能率的なSAMの変種であるFastSAMの視覚エンコーダを用いて、RSシーンの視覚表現を抽出する。
SAMの特徴に固有の意味表現を活用するために、両時間RSIにおける意味潜在をモデル化するためのタスク非依存の意味学習ブランチを導入する。
その結果, SAMCDはSOTA法よりも精度が高く, セミに匹敵するサンプル効率の学習能力を示す。
論文 参考訳(メタデータ) (2023-09-04T08:23:31Z) - A generic self-supervised learning (SSL) framework for representation
learning from spectra-spatial feature of unlabeled remote sensing imagery [4.397725469518669]
自己教師付き学習(SSL)では、モデルが桁違いに遅延のないデータから表現を学習することができる。
この研究は、未ラベルデータのスペクトル空間情報の両方から表現を学習できる新しいSSLフレームワークを設計した。
論文 参考訳(メタデータ) (2023-06-27T23:50:43Z) - Learning Self-Supervised Low-Rank Network for Single-Stage Weakly and
Semi-Supervised Semantic Segmentation [119.009033745244]
本稿では,単一段階弱教師付きセマンティックセマンティックセマンティックセマンティクス(WSSS)と半教師付きセマンティクスセマンティクスセマンティクス(SSSS)のための自己教師付き低ランクネットワーク(SLRNet)を提案する。
SLRNetは、画像の異なるビューから複数の注意深いLR表現を同時に予測し、正確な擬似ラベルを学習する。
Pascal VOC 2012、COCO、L2IDデータセットの実験では、SLRNetは最先端のWSSSメソッドとSSSSメソッドの両方で、さまざまな設定で優れています。
論文 参考訳(メタデータ) (2022-03-19T09:19:55Z) - Multi-level Second-order Few-shot Learning [111.0648869396828]
教師付きまたは教師なしの少数ショット画像分類と少数ショット動作認識のためのマルチレベル2次数列学習ネットワーク(MlSo)を提案する。
我々は、パワーノーマライズされた二階学習者ストリームと、複数のレベルの視覚的抽象化を表現する機能を組み合わせた、いわゆる2階学習者ストリームを活用している。
我々は,Omniglot, mini-ImageNet, tiered-ImageNet, Open MIC, CUB Birds, Stanford Dogs, Cars, HMDB51, UCF101, mini-MITなどのアクション認識データセットなどの標準データセットに対して,優れた結果を示す。
論文 参考訳(メタデータ) (2022-01-15T19:49:00Z) - Multi-Content Complementation Network for Salient Object Detection in
Optical Remote Sensing Images [108.79667788962425]
光リモートセンシング画像(RSI-SOD)における有能な物体検出は、いまだに課題である。
本稿では, RSI-SOD における複数コンテンツの相補性を検討するために, MCCNet (Multi-Content Complementation Network) を提案する。
MCCMでは、前景機能、エッジ機能、背景機能、グローバル画像レベル機能など、RSI-SODにとって重要な複数の機能について検討する。
論文 参考訳(メタデータ) (2021-12-02T04:46:40Z) - Remote Sensing Images Semantic Segmentation with General Remote Sensing
Vision Model via a Self-Supervised Contrastive Learning Method [13.479068312825781]
リモートセマンティックセグメンテーションのためのGlobal style and Local matching Contrastive Learning Network (GLCNet)を提案する。
具体的には、画像レベルの表現をより良く学習するために、グローバルスタイルのコントラストモジュールが使用される。
コントラストモジュールにマッチするローカル特徴は、セマンティックセグメンテーションに有用なローカル領域の表現を学習するために設計されている。
論文 参考訳(メタデータ) (2021-06-20T03:03:40Z) - Multimodal Remote Sensing Benchmark Datasets for Land Cover
Classification with A Shared and Specific Feature Learning Model [36.993630058695345]
マルチモーダルRSデータをモダリティ共有およびモダリティ固有成分に分解するための共有特徴学習(S2FL)モデルを提案する。
マルチモーダルベースラインと新たに提案されたS2FLモデルを評価するために、3つのマルチモーダルRSベンチマークデータセット、すなわちHouston2013 -- hyperspectral and multispectral data, Berlin -- hyperspectral and synthetic Aperture radar (SAR) data, Augsburg -- hyperspectral, SAR, digital surface model (DSM) dataがリリースされ、土地被覆分類に使用される。
論文 参考訳(メタデータ) (2021-05-21T08:14:21Z) - Hyperspectral Image Super-Resolution with Spectral Mixup and
Heterogeneous Datasets [99.92564298432387]
ハイパースペクトル画像(HSI)超解像(SR)の研究
HSI SRは高次元データと限られたトレーニング例によって特徴づけられる。
これにより、非分布サンプルに対する記憶や感度などのニューラルネットワークの望ましくない動作が悪化する。
論文 参考訳(メタデータ) (2021-01-19T12:19:53Z) - Remote Sensing Image Scene Classification with Self-Supervised Paradigm
under Limited Labeled Samples [11.025191332244919]
我々は,大規模なラベル付きデータからRSIシーン分類のための高性能事前学習モデルを得るために,新たな自己教師付き学習(SSL)機構を導入する。
一般的な3つのRSIシーン分類データセットの実験により、この新たな学習パラダイムは、従来の支配的なImageNet事前学習モデルよりも優れていることが示された。
我々の研究から得られた知見は、リモートセンシングコミュニティにおけるSSLの発展を促進するのに役立ちます。
論文 参考訳(メタデータ) (2020-10-02T09:27:19Z) - X-ModalNet: A Semi-Supervised Deep Cross-Modal Network for
Classification of Remote Sensing Data [69.37597254841052]
我々はX-ModalNetと呼ばれる新しいクロスモーダルディープラーニングフレームワークを提案する。
X-ModalNetは、ネットワークの上部にある高レベルな特徴によって構築されたアップダスタブルグラフ上にラベルを伝搬するため、うまく一般化する。
我々は2つのマルチモーダルリモートセンシングデータセット(HSI-MSIとHSI-SAR)上でX-ModalNetを評価し、いくつかの最先端手法と比較して大幅に改善した。
論文 参考訳(メタデータ) (2020-06-24T15:29:41Z) - ResNeSt: Split-Attention Networks [86.25490825631763]
このアーキテクチャは、異なるネットワークブランチにチャンネルワイズを応用し、機能間相互作用のキャプチャと多様な表現の学習の成功を活用する。
我々のモデルはResNeStと呼ばれ、画像分類の精度と遅延トレードオフにおいてEfficientNetより優れています。
論文 参考訳(メタデータ) (2020-04-19T20:40:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。