論文の概要: CGEarthEye:A High-Resolution Remote Sensing Vision Foundation Model Based on the Jilin-1 Satellite Constellation
- arxiv url: http://arxiv.org/abs/2507.00356v1
- Date: Tue, 01 Jul 2025 01:05:18 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-03 14:22:59.15145
- Title: CGEarthEye:A High-Resolution Remote Sensing Vision Foundation Model Based on the Jilin-1 Satellite Constellation
- Title(参考訳): CGEarthEye:JIL-1衛星コンステレーションに基づく高分解能リモートセンシングビジョン基礎モデル
- Authors: Zhiwei Yi, Xin Cheng, Jingyu Ma, Ruifei Zhu, Junwei Tian, Yuanxiu Zhou, Xinge Zhao, Hongzhe Li,
- Abstract要約: ジリン-1(英: Jilin-1)は、世界最大の準メートル級商業RS衛星である。
本研究は,Jilin-1衛星特性に特化して設計されたRSVFMフレームワークであるCGEarthEyeを提案する。
- 参考スコア(独自算出の注目度): 3.5464435279468907
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Deep learning methods have significantly advanced the development of intelligent rinterpretation in remote sensing (RS), with foundational model research based on large-scale pre-training paradigms rapidly reshaping various domains of Earth Observation (EO). However, compared to the open accessibility and high spatiotemporal coverage of medium-resolution data, the limited acquisition channels for ultra-high-resolution optical RS imagery have constrained the progress of high-resolution remote sensing vision foundation models (RSVFM). As the world's largest sub-meter-level commercial RS satellite constellation, the Jilin-1 constellation possesses abundant sub-meter-level image resources. This study proposes CGEarthEye, a RSVFM framework specifically designed for Jilin-1 satellite characteristics, comprising five backbones with different parameter scales with totaling 2.1 billion parameters. To enhance the representational capacity of the foundation model, we developed JLSSD, the first 15-million-scale multi-temporal self-supervised learning (SSL) dataset featuring global coverage with quarterly temporal sampling within a single year, constructed through multi-level representation clustering and sampling strategies. The framework integrates seasonal contrast, augmentation-based contrast, and masked patch token contrastive strategies for pre-training. Comprehensive evaluations across 10 benchmark datasets covering four typical RS tasks demonstrate that the CGEarthEye consistently achieves state-of-the-art (SOTA) performance. Further analysis reveals CGEarthEye's superior characteristics in feature visualization, model convergence, parameter efficiency, and practical mapping applications. This study anticipates that the exceptional representation capabilities of CGEarthEye will facilitate broader and more efficient applications of Jilin-1 data in traditional EO application.
- Abstract(参考訳): 深層学習法は、リモートセンシング(RS)における知的解釈の発達を著しく前進させ、地球観測(EO)の様々な領域を迅速に再構築する大規模事前学習パラダイムに基づく基礎モデル研究を行っている。
しかし、中分解能データのオープンアクセシビリティと高時空間カバレッジと比較して、超高分解能光RS画像の限られた取得チャネルは、高分解能リモートセンシング視覚基盤モデル(RSVFM)の進歩を妨げている。
世界最大のサブメートル級商用RS衛星コンステレーションであるジリン-1は、豊富なサブメートル級の画像資源を保有している。
本研究では,Jilin-1衛星特性に特化して設計されたSVFMフレームワークであるCGEarthEyeを提案する。
基礎モデルの表現能力を高めるため,多段階の表現クラスタリングとサンプリング戦略によって構築された,一年以内にグローバルカバレッジを備えた,最初の15万件規模のマルチテンポラル自己教師学習(SSL)データセットであるJLSSDを開発した。
このフレームワークは、季節的なコントラスト、拡張ベースのコントラスト、および事前トレーニングのためのマスク付きパッチトークンコントラスト戦略を統合する。
典型的な4つのRSタスクをカバーする10のベンチマークデータセットの包括的な評価は、CGEarthEyeが一貫して最先端(SOTA)のパフォーマンスを実現していることを示している。
さらに分析した結果,特徴視覚化,モデル収束,パラメータ効率,実用的なマッピングアプリケーションにおいて,CGEarthEyeの優れた特徴が明らかになった。
本研究は、従来のEOアプリケーションにおいて、CGEarthEyeの例外的表現能力により、Jilin-1データのより広範かつ効率的に適用できるようになることを予測している。
関連論文リスト
- TESSERA: Temporal Embeddings of Surface Spectra for Earth Representation and Analysis [0.24199968850337347]
TESSERA(Remote Sensing Foundation Model, RSFM)は, 自己監督学習(SSL)を用いて, 画素レベルの衛星時系列データから, グローバルかつ堅牢な表現を10mスケールで生成する。
以上の結果から,TESSERAは多様な下流タスクにおいて従来のRSベースラインと主要な地理空間基盤モデルよりも優れていた。
論文 参考訳(メタデータ) (2025-06-25T12:46:26Z) - TerraFM: A Scalable Foundation Model for Unified Multisensor Earth Observation [65.74990259650984]
本研究では,グローバルに分散したSentinel-1とSentinel-2画像を利用する,スケーラブルな自己教師型学習モデルTerraFMを紹介する。
我々のトレーニング戦略は、局所的・言語的コントラスト学習を統合し、二重中心化機構を導入する。
TerraFMは分類タスクとセグメンテーションタスクの両方において強力な一般化を実現し、GEO-BenchとCopernicus-Benchの先行モデルよりも優れている。
論文 参考訳(メタデータ) (2025-06-06T17:59:50Z) - Efficient Self-Supervised Learning for Earth Observation via Dynamic Dataset Curation [67.23953699167274]
自己教師付き学習(SSL)により、地球観測のための視覚基盤モデルの開発が可能になった。
EOでは、この課題は衛星画像に共通する冗長性と重尾分布によって増幅される。
本稿では,データセットの多様性とバランスを最大化し,SSL事前トレーニングを改善するために設計された動的データセットプルーニング戦略を提案する。
論文 参考訳(メタデータ) (2025-04-09T15:13:26Z) - SpectralEarth: Training Hyperspectral Foundation Models at Scale [47.93167977587301]
ハイパースペクトル基礎モデルの事前学習を目的とした大規模マルチ時間データセットであるSpectralEarthを紹介する。
我々は、最先端の自己教師付き学習(SSL)アルゴリズムを用いて、SpectralEarthの一連の基礎モデルを事前訓練する。
我々は、土地被覆と収穫型マッピングのための4つの下流データセットを構築し、モデル評価のためのベンチマークを提供する。
論文 参考訳(メタデータ) (2024-08-15T22:55:59Z) - SARATR-X: Toward Building A Foundation Model for SAR Target Recognition [22.770010893572973]
SAR ATRの基盤モデル構築に向けた最初の試みをSARATR-Xと呼ぶ。
SARATR-Xは、自己教師付き学習(SSL)を通じて一般化可能な表現を学び、汎用的なSARターゲット検出と分類タスクへのラベル効率のモデル適応のための基盤を提供する。
SARATR-Xは0.18Mの未ラベルのSARターゲットサンプルで訓練されており、これは同時代のベンチマークを組み合わせてキュレーションされ、これまでで最大の公開データセットとなっている。
論文 参考訳(メタデータ) (2024-05-15T14:17:44Z) - Exploiting Self-Supervised Constraints in Image Super-Resolution [72.35265021054471]
本稿では,SSC-SRと呼ばれる単一画像超解像のための新しい自己監督制約を提案する。
SSC-SRは、安定性を高めるために指数移動平均によって更新された二重非対称パラダイムとターゲットモデルを用いることで、画像の複雑さのばらつきに一意に対処する。
SSC-SRフレームワークはさまざまなベンチマークデータセットに対して,EDSR平均0.1dB,SwinIR平均0.06dBの大幅な拡張を実現している。
論文 参考訳(メタデータ) (2024-03-30T06:18:50Z) - Recognize Any Regions [55.76437190434433]
RegionSpotは、ローカライゼーション基盤モデルから位置認識ローカライゼーション知識と、ViLモデルからのセマンティック情報を統合する。
オープンワールドオブジェクト認識の実験では、私たちのRereaSpotは、以前の代替よりも大きなパフォーマンス向上を実現しています。
論文 参考訳(メタデータ) (2023-11-02T16:31:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。