論文の概要: LandSegmenter: Towards a Flexible Foundation Model for Land Use and Land Cover Mapping
- arxiv url: http://arxiv.org/abs/2511.08156v1
- Date: Wed, 12 Nov 2025 01:43:11 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-12 20:17:03.672856
- Title: LandSegmenter: Towards a Flexible Foundation Model for Land Use and Land Cover Mapping
- Title(参考訳): LandSegmenter: 土地利用と土地被覆マッピングのための柔軟な基礎モデルを目指して
- Authors: Chenying Liu, Wei Huang, Xiao Xiang Zhu,
- Abstract要約: 土地利用と土地被覆(LULC)マッピングは、地球観測の基本的な課題である。
ファンデーションモデル(FM)の最近の進歩は、ユニバーサルモデルを構築するための有望な機会を提供する。
本研究では,LandSegmenterを提案する。LULC FMフレームワークは,入力,モデル,出力レベルにおける3段階の課題を解決する。
- 参考スコア(独自算出の注目度): 13.59442852640533
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Land Use and Land Cover (LULC) mapping is a fundamental task in Earth Observation (EO). However, current LULC models are typically developed for a specific modality and a fixed class taxonomy, limiting their generability and broader applicability. Recent advances in foundation models (FMs) offer promising opportunities for building universal models. Yet, task-agnostic FMs often require fine-tuning for downstream applications, whereas task-specific FMs rely on massive amounts of labeled data for training, which is costly and impractical in the remote sensing (RS) domain. To address these challenges, we propose LandSegmenter, an LULC FM framework that resolves three-stage challenges at the input, model, and output levels. From the input side, to alleviate the heavy demand on labeled data for FM training, we introduce LAnd Segment (LAS), a large-scale, multi-modal, multi-source dataset built primarily with globally sampled weak labels from existing LULC products. LAS provides a scalable, cost-effective alternative to manual annotation, enabling large-scale FM training across diverse LULC domains. For model architecture, LandSegmenter integrates an RS-specific adapter for cross-modal feature extraction and a text encoder for semantic awareness enhancement. At the output stage, we introduce a class-wise confidence-guided fusion strategy to mitigate semantic omissions and further improve LandSegmenter's zero-shot performance. We evaluate LandSegmenter on six precisely annotated LULC datasets spanning diverse modalities and class taxonomies. Extensive transfer learning and zero-shot experiments demonstrate that LandSegmenter achieves competitive or superior performance, particularly in zero-shot settings when transferred to unseen datasets. These results highlight the efficacy of our proposed framework and the utility of weak supervision for building task-specific FMs.
- Abstract(参考訳): 土地利用と土地被覆(LULC)マッピングは、地球観測(EO)の基本課題である。
しかし、現在のLULCモデルは、通常、特定のモダリティと固定クラス分類のために開発され、その生成可能性とより広範な適用性を制限する。
ファンデーションモデル(FM)の最近の進歩は、ユニバーサルモデルを構築するための有望な機会を提供する。
しかし、タスク非依存のFMはダウンストリームアプリケーションには微調整を必要とすることが多いが、タスク固有のFMはトレーニングのために大量のラベル付きデータに依存しており、これはリモートセンシング(RS)ドメインでは高価で実用的ではない。
これらの課題に対処するため,LandSegmenterを提案する。LULC FMフレームワークは,入力,モデル,出力レベルにおける3段階の課題を解決する。
入力側から、FMトレーニングのためのラベル付きデータに対する大きな需要を軽減するため、LAnd Segment (LAS)を導入します。
LASは手動アノテーションに代わるスケーラブルで費用対効果の高い代替手段を提供し、多様なLULCドメインにわたる大規模なFMトレーニングを可能にする。
モデルアーキテクチャにおいて、LandSegmenterは、クロスモーダルな特徴抽出のためのRS固有のアダプタと、意味認識向上のためのテキストエンコーダを統合している。
出力段階では、セマンティックな省略を緩和し、LandSegmenterのゼロショット性能をさらに改善するために、クラスワイドな信頼誘導融合戦略を導入する。
そこで,LandSegmenterを,多種多様な分類群と分類群にまたがる6つの正確なLULCデータセット上で評価した。
大規模な転送学習とゼロショット実験は、LandSegmenterが競争力や優れたパフォーマンスを実現していることを示している。
これらの結果から,提案手法の有効性と,タスク固有FM構築における弱監督の有用性が示された。
関連論文リスト
- Multi-Level Heterogeneous Knowledge Transfer Network on Forward Scattering Center Model for Limited Samples SAR ATR [10.701687030427422]
本研究は,前向き散乱中心モデル(FSCM)という,純粋および鍵標的知識を移行するための新しいシミュレーションデータについて検討する。
この目的を達成するために,FSCMの知識を特徴,分布,カテゴリレベルから完全に移行する多レベル異種知識伝達ネットワークを提案する。
特に,FSCMデータとSAR画像による2つの新しいデータセットに対する広範な実験により,本手法の優れた性能が示された。
論文 参考訳(メタデータ) (2025-09-28T03:04:04Z) - Closer to Reality: Practical Semi-Supervised Federated Learning for Foundation Model Adaptation [56.36237936346563]
ファンデーションモデル(FM)は顕著な一般化を示すが、下流のタスクに適応する必要がある。
データプライバシー規制のため、クラウドベースのFMはプライベートエッジデータに直接アクセスできない。
エッジデバイスがラベルのない低解像度のデータのみを保持する実践的セミスーパービジョン・フェデレーションラーニング(PSSFL)を導入する。
我々の研究は、フェデレートされたシナリオにおけるスケーラブルでプライバシ保護のFM適応の道を開いた。
論文 参考訳(メタデータ) (2025-08-22T17:47:02Z) - TerraFM: A Scalable Foundation Model for Unified Multisensor Earth Observation [65.74990259650984]
本研究では,グローバルに分散したSentinel-1とSentinel-2画像を利用する,スケーラブルな自己教師型学習モデルTerraFMを紹介する。
我々のトレーニング戦略は、局所的・言語的コントラスト学習を統合し、二重中心化機構を導入する。
TerraFMは分類タスクとセグメンテーションタスクの両方において強力な一般化を実現し、GEO-BenchとCopernicus-Benchの先行モデルよりも優れている。
論文 参考訳(メタデータ) (2025-06-06T17:59:50Z) - Large Wireless Localization Model (LWLM): A Foundation Model for Positioning in 6G Networks [26.30108656575931]
本稿では,無線位置決めに適したファンデーションモデルに基づくソリューションを提案する。
まず、異なる自己教師付き学習(SSL)タスクが汎用的およびタスク固有の意味的特徴をどのように獲得するかを分析する。
提案するLarge Wireless Localization Model (LWLM) の事前学習手法を設計する。
論文 参考訳(メタデータ) (2025-05-15T10:04:44Z) - FineScope : Precision Pruning for Domain-Specialized Large Language Models Using SAE-Guided Self-Data Cultivation [3.5023779900630028]
FineScopeは、より大きな事前訓練されたモデルからドメイン最適化言語モデルを導出するためのフレームワークである。
構造的プルーニングをドメイン固有の制約で適用し、結果のモデルが対象ドメインに不可欠な知識を保持することを保証します。
実験とアブレーション実験により、FinScopeは高い競争力を発揮することが示された。
論文 参考訳(メタデータ) (2025-05-01T16:05:08Z) - FMARS: Annotating Remote Sensing Images for Disaster Management using Foundation Models [0.8795040582681392]
FMARS(Foundation Model s in Remote Sensing)は、VHR画像と基礎モデルを高速で堅牢なアノテーションに活用する方法論である。
災害管理に焦点をあて,19件の災害イベントの事前画像から得られたラベルを用いた大規模データセットを提供する。
実世界のシナリオへの転送可能性を高めるために、Unsupervised Adaptation (UDA) 技術を用いて、生成されたラベルのセグメンテーションモデルを訓練する。
論文 参考訳(メタデータ) (2024-05-30T14:45:02Z) - Recognize Any Regions [55.76437190434433]
RegionSpotは、ローカライゼーション基盤モデルから位置認識ローカライゼーション知識と、ViLモデルからのセマンティック情報を統合する。
オープンワールドオブジェクト認識の実験では、私たちのRereaSpotは、以前の代替よりも大きなパフォーマンス向上を実現しています。
論文 参考訳(メタデータ) (2023-11-02T16:31:49Z) - FederatedScope-LLM: A Comprehensive Package for Fine-tuning Large
Language Models in Federated Learning [70.38817963253034]
本稿では, ファインチューニング LLM のこれらの課題について論じ, 本パッケージ FS-LLM を主な貢献として紹介する。
我々は、FLシナリオにおける将来の拡張のために、包括的フェデレーションパラメータ効率の良い微調整アルゴリズムの実装と汎用プログラミングインタフェースを提供する。
本研究では, FS-LLM の有効性を検証し, FL 設定におけるパラメータ効率の高いパラメータ調整アルゴリズムを用いて, 高度な LLM のベンチマークを行う。
論文 参考訳(メタデータ) (2023-09-01T09:40:36Z) - Robust Saliency-Aware Distillation for Few-shot Fine-grained Visual
Recognition [57.08108545219043]
サンプルが少ない新しいサブカテゴリを認識することは、コンピュータビジョンにおいて不可欠で挑戦的な研究課題である。
既存の文献は、ローカルベースの表現アプローチを採用することでこの問題に対処している。
本稿では,ロバスト・サリエンシ・アウェア蒸留法(RSaD)を提案する。
論文 参考訳(メタデータ) (2023-05-12T00:13:17Z) - CHALLENGER: Training with Attribution Maps [63.736435657236505]
ニューラルネットワークのトレーニングに属性マップを利用すると、モデルの正規化が向上し、性能が向上することを示す。
特に、我々の汎用的なドメインに依存しないアプローチは、ビジョン、自然言語処理、時系列タスクにおける最先端の結果をもたらすことを示す。
論文 参考訳(メタデータ) (2022-05-30T13:34:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。