論文の概要: Position Prediction Self-Supervised Learning for Multimodal Satellite Imagery Semantic Segmentation
- arxiv url: http://arxiv.org/abs/2506.06852v1
- Date: Sat, 07 Jun 2025 16:16:29 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-10 16:33:10.528843
- Title: Position Prediction Self-Supervised Learning for Multimodal Satellite Imagery Semantic Segmentation
- Title(参考訳): 多モード衛星画像のセマンティックセグメンテーションのための位置予測自己教師付き学習
- Authors: John Waithaka, Moise Busogi,
- Abstract要約: マルチモーダル衛星画像セマンティックセグメンテーションのための位置予測自己教師付き学習手法LOCA(Location-aware)を提案する。
提案手法は,SatMAEのチャネル群をマルチスペクトルからマルチモーダルデータに拡張することで,衛星データのユニークな課題に対処する。
Sen1Floods11フラッドマッピングデータセットに対する我々のアプローチの評価を行い、衛星画像の再構成に基づく自己教師型学習手法を著しく上回る結果を得た。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Semantic segmentation of satellite imagery is crucial for Earth observation applications, but remains constrained by limited labelled training data. While self-supervised pretraining methods like Masked Autoencoders (MAE) have shown promise, they focus on reconstruction rather than localisation-a fundamental aspect of segmentation tasks. We propose adapting LOCA (Location-aware), a position prediction self-supervised learning method, for multimodal satellite imagery semantic segmentation. Our approach addresses the unique challenges of satellite data by extending SatMAE's channel grouping from multispectral to multimodal data, enabling effective handling of multiple modalities, and introducing same-group attention masking to encourage cross-modal interaction during pretraining. The method uses relative patch position prediction, encouraging spatial reasoning for localisation rather than reconstruction. We evaluate our approach on the Sen1Floods11 flood mapping dataset, where it significantly outperforms existing reconstruction-based self-supervised learning methods for satellite imagery. Our results demonstrate that position prediction tasks, when properly adapted for multimodal satellite imagery, learn representations more effective for satellite image semantic segmentation than reconstruction-based approaches.
- Abstract(参考訳): 衛星画像のセマンティックセグメンテーションは、地球観測への応用には不可欠であるが、限られたラベル付きトレーニングデータによって制限されている。
Masked Autoencoders (MAE) のような自己監督型事前学習手法は、将来性を示しているが、セグメンテーションタスクの基本的な側面であるローカライゼーションよりも再構築に焦点を当てている。
マルチモーダル衛星画像セマンティックセグメンテーションのための位置予測自己教師付き学習手法LOCA(Location-aware)を提案する。
提案手法は,SatMAEのチャネルグループ化をマルチスペクトルからマルチモーダルデータに拡張し,複数のモーダルを効果的に扱えるようにし,プリトレーニング中の相互モーダル相互作用を促進するために,同一グループアテンションマスキングを導入することで,衛星データのユニークな課題に対処する。
本手法は相対的パッチ位置予測を用い,空間的推論を再構築ではなく局所化に促進する。
Sen1Floods11フラッドマッピングデータセットに対する我々のアプローチの評価を行い、衛星画像の再構成に基づく自己教師型学習手法を著しく上回る結果を得た。
その結果, 位置予測タスクがマルチモーダル衛星画像に適切に適合すると, 衛星画像のセマンティックセグメンテーションにおいて, 再構成に基づくアプローチよりも効果的に表現を学習できることが示唆された。
関連論文リスト
- Evaluating the Efficacy of Cut-and-Paste Data Augmentation in Semantic Segmentation for Satellite Imagery [4.499833362998487]
本研究では,衛星画像のセマンティックセグメンテーションにおけるカット・アンド・ペースト拡張手法の有効性について検討した。
私たちは、通常ラベル付きインスタンスを必要とするこの拡張を、セマンティックセグメンテーションのケースに適用します。
評価のためにDynamicEarthNetデータセットとU-Netモデルを用いて、この拡張により、テストセットのmIoUスコアが37.9から44.1に大幅に向上することを発見した。
論文 参考訳(メタデータ) (2024-04-08T17:18:30Z) - SatSynth: Augmenting Image-Mask Pairs through Diffusion Models for Aerial Semantic Segmentation [69.42764583465508]
我々は,地球観測における注釈付きデータの不足に対処するために,生成的画像拡散の可能性を探る。
我々の知る限りでは、衛星セグメンテーションのための画像と対応するマスクの両方を最初に生成する。
論文 参考訳(メタデータ) (2024-03-25T10:30:22Z) - Location-Aware Self-Supervised Transformers [74.76585889813207]
画像部品の相対的な位置を予測し,セマンティックセグメンテーションのためのネットワークを事前訓練する。
参照パッチのサブセットを問合せのサブセットにマスキングすることで,タスクの難しさを制御します。
実験により,この位置認識事前学習が,いくつかの難解なセマンティックセグメンテーションベンチマークに競合する表現をもたらすことが示された。
論文 参考訳(メタデータ) (2022-12-05T16:24:29Z) - SatMAE: Pre-training Transformers for Temporal and Multi-Spectral
Satellite Imagery [74.82821342249039]
Masked Autoencoder(MAE)に基づく時間・マルチスペクトル衛星画像の事前学習フレームワークであるSatMAEについて述べる。
時間的情報を活用するために、時間にわたって画像パッチを個別にマスキングする時間的埋め込みを含む。
論文 参考訳(メタデータ) (2022-07-17T01:35:29Z) - Towards On-Board Panoptic Segmentation of Multispectral Satellite Images [41.34294145237618]
マルチスペクトル衛星画像の単眼分割のための軽量パイプラインを提案する。
パノプティカル・セグメンテーションは、農地からの収量推定から複雑な軍事用途のための知性まで、主要な経済・環境の洞察を提供する。
本評価は,既存の最先端モデルと比較して精度が大幅に向上したことを示す。
論文 参考訳(メタデータ) (2022-04-05T03:10:39Z) - Embedding Earth: Self-supervised contrastive pre-training for dense land
cover classification [61.44538721707377]
本研究では,衛星画像の高可用性を活用するための自己監督型コントラスト事前学習法として,エンベディングアースを提案する。
提案手法による事前学習では, 25%の絶対mIoUが得られた。
学習した特徴は、異なる領域間で一般化され、提案した事前学習スキームの可能性を開放する。
論文 参考訳(メタデータ) (2022-03-11T16:14:14Z) - Context-self contrastive pretraining for crop type semantic segmentation [39.81074867563505]
提案したContext-Self Contrastive Loss (CSCL)は、セマンティックバウンダリをポップアップさせる埋め込み空間を学習する。
衛星画像時系列(SITS)からの作物型セマンティックセマンティックセグメンテーションでは,サテライト境界における性能が重要なボトルネックとなる。
より粒度の高い作物のクラスを得るための超解像における意味的セグメンテーションのプロセスを提案する。
論文 参考訳(メタデータ) (2021-04-09T11:29:44Z) - Spatially Consistent Representation Learning [12.120041613482558]
本研究では,空間的に一貫した表現学習アルゴリズム(SCRL)を提案する。
ランダムに切り抜かれた局所領域のコヒーレントな空間表現を作ろうとする新しい自己教師付き目的を考案する。
ベンチマークデータセットを用いた下流のローカライゼーションタスクでは、提案したSCRLは大幅な性能改善を示す。
論文 参考訳(メタデータ) (2021-03-10T15:23:45Z) - Self-supervised Segmentation via Background Inpainting [96.10971980098196]
移動可能なカメラで撮影された単一の画像で、自己教師付き検出とセグメンテーションのアプローチを導入する。
我々は、提案に基づくセグメンテーションネットワークのトレーニングに利用する自己教師付き損失関数を利用する。
本手法は,標準ベンチマークから視覚的に切り離された画像の人間の検出とセグメント化に応用し,既存の自己監督手法より優れていることを示す。
論文 参考訳(メタデータ) (2020-11-11T08:34:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。