論文の概要: SatDINO: A Deep Dive into Self-Supervised Pretraining for Remote Sensing
- arxiv url: http://arxiv.org/abs/2508.21402v1
- Date: Fri, 29 Aug 2025 08:19:16 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-01 19:45:10.964383
- Title: SatDINO: A Deep Dive into Self-Supervised Pretraining for Remote Sensing
- Title(参考訳): SatDino:リモートセンシングのための自己監督型事前トレーニング
- Authors: Jakub Straka, Ivan Gruber,
- Abstract要約: 自己教師付き学習は、大量のラベルのないデータが利用できるリモートセンシングの強力なツールとして登場した。
本研究では,リモートセンシング画像の事前学習において,コントラスト型自己教師手法であるDINOを用いて検討する。
衛星画像における表現学習に適したモデルであるSatDinoを紹介する。
- 参考スコア(独自算出の注目度): 0.3437656066916039
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Self-supervised learning has emerged as a powerful tool for remote sensing, where large amounts of unlabeled data are available. In this work, we investigate the use of DINO, a contrastive self-supervised method, for pretraining on remote sensing imagery. We introduce SatDINO, a model tailored for representation learning in satellite imagery. Through extensive experiments on multiple datasets in multiple testing setups, we demonstrate that SatDINO outperforms other state-of-the-art methods based on much more common masked autoencoders (MAE) and achieves competitive results in multiple benchmarks. We also provide a rigorous ablation study evaluating SatDINO's individual components. Finally, we propose a few novel enhancements, such as a new way to incorporate ground sample distance (GSD) encoding and adaptive view sampling. These enhancements can be used independently on our SatDINO model. Our code and trained models are available at: https://github.com/strakaj/SatDINO.
- Abstract(参考訳): 自己教師付き学習は、大量のラベルのないデータが利用できるリモートセンシングの強力なツールとして登場した。
本研究では,リモートセンシング画像の事前学習において,コントラスト型自己教師手法であるDINOを用いて検討する。
衛星画像における表現学習に適したモデルであるSatDinoを紹介する。
複数のテストセットアップにおける複数のデータセットに関する広範な実験を通じて、より一般的なマスク付きオートエンコーダ(MAE)に基づいて、SatDINOが他の最先端メソッドよりも優れており、複数のベンチマークで競合する結果が得られることを示した。
また,サットディーノの個々の成分を評価する厳密なアブレーション研究も行った。
最後に,地中サンプル距離(GSD)エンコーディングと適応的なビューサンプリングを取り入れた新しい手法を提案する。
これらの拡張は、当社のSatDINOモデルで独立して使用することができます。
私たちのコードとトレーニングされたモデルは、https://github.com/strakaj/SatDINO.comで利用可能です。
関連論文リスト
- Private Training & Data Generation by Clustering Embeddings [74.00687214400021]
差分プライバシー(DP)は、個々のデータを保護するための堅牢なフレームワークを提供する。
本稿では,DP合成画像埋め込み生成のための新しい原理的手法を提案する。
経験的に、合成的に生成された埋め込みに基づいて訓練された単純な2層ニューラルネットワークは、最先端(SOTA)分類の精度を達成する。
論文 参考訳(メタデータ) (2025-06-20T00:17:14Z) - Rethinking Transformers Pre-training for Multi-Spectral Satellite
Imagery [78.43828998065071]
教師なし学習の最近の進歩は、下流タスクにおける有望な結果を達成するための大きな視覚モデルの可能性を示している。
このような事前学習技術は、大量の未学習データが利用可能であることから、リモートセンシング領域でも最近研究されている。
本稿では,マルチモーダルで効果的に活用されるマルチスケール情報の事前学習と活用について述べる。
論文 参考訳(メタデータ) (2024-03-08T16:18:04Z) - Exploring DINO: Emergent Properties and Limitations for Synthetic
Aperture Radar Imagery [5.057850174013128]
本研究では,No Labels(DINO)アルゴリズムによる自己蒸留の創発的特性と合成開口レーダ(SAR)画像への応用について検討する。
我々は、ラベルのないSARデータを用いて視覚変換器(ViT)ベースのDINOモデルを事前訓練し、その後、高解像度のランドカバーマップを予測するためにモデルを微調整する。
本稿では,VTアテンションマップがリモートセンシングの本質的な価値を保ち,他のアルゴリズムに有用なインプットを提供することを示す。
論文 参考訳(メタデータ) (2023-10-05T12:48:12Z) - Semantic Segmentation of Vegetation in Remote Sensing Imagery Using Deep
Learning [77.34726150561087]
本稿では,公開されているリモートセンシングデータからなるマルチモーダル・大規模時間データセットを作成するためのアプローチを提案する。
我々は、異なる種類の植生を分離できる畳み込みニューラルネットワーク(CNN)モデルを使用する。
論文 参考訳(メタデータ) (2022-09-28T18:51:59Z) - TTAPS: Test-Time Adaption by Aligning Prototypes using Self-Supervision [70.05605071885914]
本研究では,単体テストサンプルに適用可能な自己教師付きトレーニングアルゴリズムSwaVの新たな改良を提案する。
ベンチマークデータセットCIFAR10-Cにおいて,本手法の有効性を示す。
論文 参考訳(メタデータ) (2022-05-18T05:43:06Z) - SEnSeI: A Deep Learning Module for Creating Sensor Independent Cloud
Masks [0.7340845393655052]
我々は、新しいニューラルネットワークアーキテクチャー、Sensor Independence(SEnSeI)のためのスペクトルエンコーダを導入する。
クラウドマスキングの問題,既存のいくつかのデータセット,Sentinel-2用の新たな無償データセットなどに注目した。
我々のモデルは、訓練した衛星(Sentinel-2とLandsat 8)の最先端性能を達成し、Landsat 7, Per'uSat-1、Sentinel-3 SLSTRのようなトレーニング中に観測されていないセンサーに外挿することができる。
論文 参考訳(メタデータ) (2021-11-16T10:47:10Z) - Representation Learning for Remote Sensing: An Unsupervised Sensor
Fusion Approach [0.0]
本稿では,複数の情報源から得られたコヒーレンスデータを利用したコントラシティブ・センサ・フュージョンを提案し,それらの組み合わせのすべての有用な表現を学習する。
4700万枚のラベルのない画像三重項のデータセットを用いて、入力センサーから可能なチャネルの組み合わせから有意義な表現を生成するエンコーダを訓練する。
これらの表現は、リモートセンシング分類タスクにおいて、完全な教師付きイメージネット重みよりも優れ、より多くのセンサーが融合するにつれて改善される。
論文 参考訳(メタデータ) (2021-08-11T08:32:58Z) - Self-supervised Audiovisual Representation Learning for Remote Sensing Data [96.23611272637943]
遠隔センシングにおける深層ニューラルネットワークの事前学習のための自己教師型アプローチを提案する。
ジオタグ付きオーディオ記録とリモートセンシングの対応を利用して、これは完全にラベルなしの方法で行われる。
提案手法は,既存のリモートセンシング画像の事前学習方法よりも優れていることを示す。
論文 参考訳(メタデータ) (2021-08-02T07:50:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。