Fugu-MT 論文翻訳(概要): A Tutorial on ALOS2 SAR Utilization: Dataset Preparation, Self-Supervised Pretraining, and Semantic Segmentation

論文の概要: A Tutorial on ALOS2 SAR Utilization: Dataset Preparation, Self-Supervised Pretraining, and Semantic Segmentation

arxiv url: http://arxiv.org/abs/2603.15119v1
Date: Mon, 16 Mar 2026 11:16:03 GMT
ステータス: 翻訳完了
システム内更新日: 2026-03-17 18:28:58.090627
Title: A Tutorial on ALOS2 SAR Utilization: Dataset Preparation, Self-Supervised Pretraining, and Semantic Segmentation
Title（参考訳）: ALOS2 SAR利用に関するチュートリアル:データセット作成、自己監督型事前訓練、セマンティックセグメンテーション
Authors: Nevrez Imamoglu, Ali Caglayan, Toru Kouyama,
Abstract要約: ALOS-2単チャネルSAR画像に適用したSimMIMの重み付き版であるSAR-W-SimMIMを紹介する。本手法は,自己指導型事前訓練におけるスペックルと極度強度値の影響を低減することを目的としている。 SAR-W-MixMAEを用いた前回の試行と比較し,セマンティックセグメンテーションへの影響を検討した。
参考スコア（独自算出の注目度）: 1.4401311275746886
License: http://creativecommons.org/licenses/by-sa/4.0/
Abstract: Masked auto-encoders (MAE) and related approaches have shown promise for satellite imagery, but their application to synthetic aperture radar (SAR) remains limited due to challenges in semantic labeling and high noise levels. Building on our prior work with SAR-W-MixMAE, which adds SAR-specific intensity-weighted loss to standard MixMAE for pretraining, we also introduce SAR-W-SimMIM; a weighted variant of SimMIM applied to ALOS-2 single-channel SAR imagery. This method aims to reduce the impact of speckle and extreme intensity values during self-supervised pretraining. We evaluate its effect on semantic segmentation compared to our previous trial with SAR-W-MixMAE and random initialization, observing notable improvements. In addition, pretraining and fine-tuning models on satellite imagery pose unique challenges, particularly when developing region-specific models. Imbalanced land cover distributions such as dominant water, forest, or desert areas can introduce bias, affecting both pretraining and downstream tasks like land cover segmentation. To address this, we constructed a SAR dataset using ALOS-2 single-channel (HH polarization) imagery focused on the Japan region, marking the initial phase toward a national-scale foundation model. This dataset was used to pretrain a vision transformer-based autoencoder, with the resulting encoder fine-tuned for semantic segmentation using a task-specific decoder. Initial results demonstrate significant performance improvements compared to training from scratch with random initialization. In summary, this work provides a guide to process and prepare ALOS2 observations to create dataset so that it can be taken advantage of self-supervised pretraining of models and finetuning downstream tasks such as semantic segmentation.
Abstract（参考訳）: Masked Auto-Encoders (MAE) と関連するアプローチは衛星画像に有望であるが、セマンティックラベリングと高雑音レベルのために合成開口レーダ (SAR) への応用は制限されている。 SAR-W-MixMAEは,SAR-W-SimMIM(SAR-W-SimMIM)とSAR-W-MixMAE(SAR-W-MixMAE)を併用して事前トレーニングを行い,SAR-W-SimMIM(SAR-W-SimMIM)の重み付き版をALOS-2単チャンネルSAR画像に適用した。本手法は,自己指導型事前訓練におけるスペックルと極度強度値の影響を低減することを目的としている。 SAR-W-MixMAEとランダム初期化によるセマンティックセグメンテーションへの影響を検討した。さらに、衛星画像の事前訓練と微調整モデルには、特に地域固有のモデルを開発する際に、固有の課題が生じる。支配的な水、森林、砂漠などの不均衡な土地被覆分布は、土地被覆分断のような事前訓練と下流の作業の両方に影響を及ぼすバイアスをもたらす可能性がある。そこで本研究では,日本地域に着目したALOS-2単一チャネル(HH偏光)画像を用いたSARデータセットを構築した。このデータセットは、視覚変換器ベースのオートエンコーダを事前トレーニングするために使用され、結果として、タスク固有のデコーダを使用してセマンティックセグメンテーションのために微調整される。最初の結果は、ランダム初期化によるスクラッチからのトレーニングと比較して、大幅なパフォーマンス改善が見られた。要約すると、この研究はALOS2観測のプロセスと準備のためのガイドを提供し、データセットを作成し、モデルの自己教師付き事前トレーニングとセマンティックセグメンテーションのような下流タスクを活用できるようにします。

関連論文リスト

Promptable Foundation Models for SAR Remote Sensing: Adapting the Segment Anything Model for Snow Avalanche Segmentation [18.28485164485434]
効果的な検出モデルのトレーニングには、ドメインの専門家による高品質なアノテーションによる大規模なデータセットの収集が必要である。我々は、自然画像に基づいて訓練されたセグメンテーション基礎モデルであるSegment Anything Model(SAM)を構築し、それをSentinel-1 SARデータに調整する。ドメインギャップを軽減するためのアダプタ,マルチチャネルSAR入力を処理する複数のエンコーダ,雪崩局所化精度を改善するためのプロンプトエンジニアリング戦略,エンコーダのトレーニング時間を制限するトレーニングアルゴリズムを組み合わせることで,これらの課題に対処する。
論文参考訳（メタデータ） (2026-01-03T15:41:12Z)
SARMAE: Masked Autoencoder for SAR Representation Learning [17.36199520462285]
自己教師型SAR表現学習のためのノイズ対応マスク付き自動エンコーダであるSARMAEを提案する。 SARMAEは、SAR固有のスペックルノイズをマスク付きオートエンコーダに注入し、ノイズ認識と堅牢な表現学習を容易にする。複数のSARデータセットに対する実験は、SARMAEが分類、検出、セグメンテーションタスクにおける最先端のパフォーマンスを達成することを示した。
論文参考訳（メタデータ） (2025-12-18T15:10:19Z)
ConformalSAM: Unlocking the Potential of Foundational Segmentation Models in Semi-Supervised Semantic Segmentation with Conformal Prediction [57.930531826380836]
本研究は,未ラベル画像のアノテータとして画素レベルの視覚課題におけるラベル不足に,基礎的セグメンテーションモデルが対処できるかどうかを考察する。 ConformalSAMは,まず対象ドメインのラベル付きデータを用いて基礎モデルを校正し,ラベルなしデータの信頼できないピクセルラベルをフィルタリングする新しいSSSSフレームワークである。
論文参考訳（メタデータ） (2025-07-21T17:02:57Z)
Efficient Self-Supervised Learning for Earth Observation via Dynamic Dataset Curation [67.23953699167274]
自己教師付き学習(SSL)により、地球観測のための視覚基盤モデルの開発が可能になった。 EOでは、この課題は衛星画像に共通する冗長性と重尾分布によって増幅される。本稿では,データセットの多様性とバランスを最大化し,SSL事前トレーニングを改善するために設計された動的データセットプルーニング戦略を提案する。
論文参考訳（メタデータ） (2025-04-09T15:13:26Z)
SAR-W-MixMAE: SAR Foundation Model Training Using Backscatter Power Weighting [3.618534280726541]
マスク付きオートエンコーダ(MAE)などの基礎モデルアプローチや、そのバリエーションが衛星画像に適用されている。セマンティックラベリングによるデータセット作成の困難さと光学画像に対する高ノイズコンテントのため、SAR(Synthetic Aperture Radar)データは基礎モデルの分野ではあまり研究されていない。本研究では,マスク付きオートエンコーダ,特にSentinel-1 SAR画像上のMixMAEとそのSAR画像分類タスクへの影響について検討した。
論文参考訳（メタデータ） (2025-03-03T05:09:44Z)
Adapting Segment Anything Model for Unseen Object Instance Segmentation [70.60171342436092]
Unseen Object Instance(UOIS)は、非構造環境で動作する自律ロボットにとって不可欠である。 UOISタスクのためのデータ効率のよいソリューションであるUOIS-SAMを提案する。 UOIS-SAMは、(i)HeatmapベースのPrompt Generator(HPG)と(ii)SAMのマスクデコーダに適応する階層識別ネットワーク(HDNet)の2つの重要なコンポーネントを統合する。
論文参考訳（メタデータ） (2024-09-23T19:05:50Z)
Impact of Noisy Supervision in Foundation Model Learning [91.56591923244943]
本論文は、事前学習データセットにおけるノイズの性質を包括的に理解し分析する最初の研究である。雑音の悪影響を緩和し、一般化を改善するため、特徴空間に適応するチューニング法(NMTune)を提案する。
論文参考訳（メタデータ） (2024-03-11T16:22:41Z)
Predicting Gradient is Better: Exploring Self-Supervised Learning for SAR ATR with a Joint-Embedding Predictive Architecture [23.375515181854254]
SSL(Self-Supervised Learning)手法は,大規模未ラベルデータの事前学習を伴う様々なSAR自動ターゲット認識(ATR)タスクを実現する。 SSLはデータから直接監視信号を構築することを目的としている。本研究では,SAR ATRの基盤モデル構築に有効なSSL方式について検討した。
論文参考訳（メタデータ） (2023-11-26T01:05:55Z)
Context-self contrastive pretraining for crop type semantic segmentation [39.81074867563505]
提案したContext-Self Contrastive Loss (CSCL)は、セマンティックバウンダリをポップアップさせる埋め込み空間を学習する。衛星画像時系列(SITS)からの作物型セマンティックセマンティックセグメンテーションでは,サテライト境界における性能が重要なボトルネックとなる。より粒度の高い作物のクラスを得るための超解像における意味的セグメンテーションのプロセスを提案する。
論文参考訳（メタデータ） (2021-04-09T11:29:44Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。