論文の概要: S5: Scalable Semi-Supervised Semantic Segmentation in Remote Sensing
- arxiv url: http://arxiv.org/abs/2508.12409v1
- Date: Sun, 17 Aug 2025 15:49:35 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-19 14:49:10.750558
- Title: S5: Scalable Semi-Supervised Semantic Segmentation in Remote Sensing
- Title(参考訳): S5: リモートセンシングにおけるスケーラブルな半スーパービジョンセマンティックセマンティックセグメンテーション
- Authors: Liang Lv, Di Wang, Jing Zhang, Lefei Zhang,
- Abstract要約: 半教師付きセマンティックセグメンテーション(S4)は、ラベルのないデータを活用することで高度なリモートセンシング(RS)分析を行う。
既存のS4研究は、しばしば小規模のデータセットとモデルに依存し、実用性を制限する。
我々は、RSにおける半教師付きセマンティックセグメンテーションのための最初のスケーラブルなフレームワークであるS5を提案する。
- 参考スコア(独自算出の注目度): 28.24280982984593
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Semi-supervised semantic segmentation (S4) has advanced remote sensing (RS) analysis by leveraging unlabeled data through pseudo-labeling and consistency learning. However, existing S4 studies often rely on small-scale datasets and models, limiting their practical applicability. To address this, we propose S5, the first scalable framework for semi-supervised semantic segmentation in RS, which unlocks the potential of vast unlabeled Earth observation data typically underutilized due to costly pixel-level annotations. Built upon existing large-scale RS datasets, S5 introduces a data selection strategy that integrates entropy-based filtering and diversity expansion, resulting in the RS4P-1M dataset. Using this dataset, we systematically scales S4 methods by pre-training RS foundation models (RSFMs) of varying sizes on this extensive corpus, significantly boosting their performance on land cover segmentation and object detection tasks. Furthermore, during fine-tuning, we incorporate a Mixture-of-Experts (MoE)-based multi-dataset fine-tuning approach, which enables efficient adaptation to multiple RS benchmarks with fewer parameters. This approach improves the generalization and versatility of RSFMs across diverse RS benchmarks. The resulting RSFMs achieve state-of-the-art performance across all benchmarks, underscoring the viability of scaling semi-supervised learning for RS applications. All datasets, code, and models will be released at https://github.com/MiliLab/S5
- Abstract(参考訳): 半教師付きセマンティックセグメンテーション(S4)は、擬似ラベルと一貫性学習を通じてラベルのないデータを活用することにより、高度なリモートセンシング(RS)分析を行う。
しかしながら、既存のS4研究はしばしば小規模のデータセットとモデルに依存し、実用性を制限する。
そこで我々は,RSにおける半教師付きセマンティックセマンティックセマンティクスの最初の拡張フレームワークであるS5を提案する。
既存の大規模RSデータセットに基づいて構築されたS5は、エントロピーベースのフィルタリングと多様性拡張を統合したデータ選択戦略を導入し、RS4P-1Mデータセットを生成する。
本データセットを用いて,この大規模コーパス上でRSFMを事前学習することにより,S4の手法を体系的に拡張し,土地被覆セグメンテーションやオブジェクト検出タスクにおける性能を大幅に向上させる。
さらに,Mixture-of-Experts (MoE) ベースのマルチデータセットファインチューニング手法を導入し,パラメータが少ない複数のRSベンチマークに効率よく適応できるようにする。
このアプローチはRSFMの多種多様なベンチマークにおける一般化と汎用性を改善する。
その結果、RSFMは全てのベンチマークで最先端のパフォーマンスを達成し、RSアプリケーションの半教師付き学習のスケーリングの実現可能性を強調している。
すべてのデータセット、コード、モデルはhttps://github.com/MiliLab/S5でリリースされる。
関連論文リスト
- Harnessing Massive Satellite Imagery with Efficient Masked Image Modeling [20.479011464156113]
Masked Image Modeling (MIM)は、リモートセンシング(RS)における基礎的な視覚モデル構築に欠かせない方法となっている。
本稿では,大規模RSデータセットの作成とMIMの効率的なアプローチを特徴とする,RSモデルの事前学習パイプラインを提案する。
本研究では,セマンティックにリッチなパッチトークンを動的にエンコードし,再構成する事前学習手法であるSelectiveMAEを提案する。
論文 参考訳(メタデータ) (2024-06-17T15:41:57Z) - GAMUS: A Geometry-aware Multi-modal Semantic Segmentation Benchmark for
Remote Sensing Data [27.63411386396492]
本稿では,RGB-Height(RGB-H)データに基づくマルチモーダルセマンティックセマンティックセマンティクスのための新しいベンチマークデータセットを提案する。
提案するベンチマークは,1)共登録RGBとnDSMペアと画素単位のセマンティックラベルを含む大規模データセットと,2)リモートセンシングデータに基づく畳み込みとトランスフォーマーベースのネットワークのための既存のマルチモーダル融合戦略の包括的評価と解析からなる。
論文 参考訳(メタデータ) (2023-05-24T09:03:18Z) - SAMRS: Scaling-up Remote Sensing Segmentation Dataset with Segment
Anything Model [85.85899655118087]
我々はSAMRSと呼ばれる大規模RSセグメンテーションデータセットを生成するための効率的なパイプラインを開発する。
SAMRSは完全に105,090の画像と1,668,241のインスタンスを持ち、既存の高解像度RSセグメンテーションデータセットを数桁上回っている。
論文 参考訳(メタデータ) (2023-05-03T10:58:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。