論文の概要: Curriculum Multi-Task Self-Supervision Improves Lightweight Architectures for Onboard Satellite Hyperspectral Image Segmentation
- arxiv url: http://arxiv.org/abs/2509.13229v1
- Date: Tue, 16 Sep 2025 16:37:59 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-17 17:50:53.174859
- Title: Curriculum Multi-Task Self-Supervision Improves Lightweight Architectures for Onboard Satellite Hyperspectral Image Segmentation
- Title(参考訳): 教育用マルチタスクセルフスーパービジョンによる衛星ハイパースペクトル画像分割のための軽量化
- Authors: Hugo Carlesso, Josiane Mothe, Radu Tudor Ionescu,
- Abstract要約: ハイパースペクトルイメージング(HSI)は、1ピクセル当たり数百の連続帯域にわたる詳細なスペクトルシグネチャをキャプチャする。
本稿では,HSI分析のための軽量アーキテクチャ用に設計された,新しいカリキュラム型マルチタスク自己教師型学習フレームワークを提案する。
CMTSSLは、マスク付き画像モデリングと、分離空間とスペクトルジグソーパズルの解法を統合している。
- 参考スコア(独自算出の注目度): 21.959448032308615
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Hyperspectral imaging (HSI) captures detailed spectral signatures across hundreds of contiguous bands per pixel, being indispensable for remote sensing applications such as land-cover classification, change detection, and environmental monitoring. Due to the high dimensionality of HSI data and the slow rate of data transfer in satellite-based systems, compact and efficient models are required to support onboard processing and minimize the transmission of redundant or low-value data, e.g. cloud-covered areas. To this end, we introduce a novel curriculum multi-task self-supervised learning (CMTSSL) framework designed for lightweight architectures for HSI analysis. CMTSSL integrates masked image modeling with decoupled spatial and spectral jigsaw puzzle solving, guided by a curriculum learning strategy that progressively increases data complexity during self-supervision. This enables the encoder to jointly capture fine-grained spectral continuity, spatial structure, and global semantic features. Unlike prior dual-task SSL methods, CMTSSL simultaneously addresses spatial and spectral reasoning within a unified and computationally efficient design, being particularly suitable for training lightweight models for onboard satellite deployment. We validate our approach on four public benchmark datasets, demonstrating consistent gains in downstream segmentation tasks, using architectures that are over 16,000x lighter than some state-of-the-art models. These results highlight the potential of CMTSSL in generalizable representation learning with lightweight architectures for real-world HSI applications. Our code is publicly available at https://github.com/hugocarlesso/CMTSSL.
- Abstract(参考訳): ハイパースペクトルイメージング(HSI)は、土地被覆分類、変化検出、環境モニタリングなどのリモートセンシングアプリケーションには不可欠である、ピクセル当たり数百の連続帯域にわたる詳細なスペクトルシグネチャをキャプチャする。
衛星ベースシステムにおけるHSIデータの高次元化とデータ転送速度の遅さのため、コンパクトで効率的なモデルがオンボード処理をサポートし、冗長データや低値データの送信を最小化するために必要である。
そこで本研究では,HSI分析のための軽量アーキテクチャ用に設計された,新しいカリキュラム型マルチタスク自己教師学習(CMTSSL)フレームワークを提案する。
CMTSSLは、マスク付き画像モデリングと、空間的およびスペクトル的なジグソーパズルの解法を統合する。
これにより、エンコーダは、微細なスペクトル連続性、空間構造、大域的な意味的特徴を共同で捉えることができる。
従来のデュアルタスクSSL法とは異なり、CMTSSLは空間的およびスペクトル的推論を統一的で効率的な設計で同時に処理し、特に衛星展開のための軽量モデルの訓練に適している。
当社のアプローチを4つの公開ベンチマークデータセットで検証し、ダウンストリームセグメンテーションタスクにおいて、いくつかの最先端モデルよりも16,000倍以上軽量なアーキテクチャを使用して、一貫した利得を示す。
これらの結果は、現実世界のHSIアプリケーションのための軽量アーキテクチャによる一般化可能な表現学習におけるCMTSSLの可能性を強調している。
私たちのコードはhttps://github.com/hugocarlesso/CMTSSLで公開されています。
関連論文リスト
- TimeSenCLIP: A Vision-Language Model for Remote Sensing Using Single-Pixel Time Series [9.263651699452996]
TimeSenCLIPは、単一のピクセルの有効性を評価することにより、空間コンテキストの役割を再評価する軽量フレームワークである。
センチネル2画像からのスペクトル情報と時間情報を活用することで、キャプションベースのトレーニングの必要性を最小限に抑える。
我々のアプローチはLUCASとSen4Mapのデータセットに基づいており、LULC、作物タイプ、生態系タイプなどの分類タスクに基づいて評価されている。
論文 参考訳(メタデータ) (2025-08-16T05:44:33Z) - Structural-Spectral Graph Convolution with Evidential Edge Learning for Hyperspectral Image Clustering [59.24638672786966]
ハイパースペクトル画像(HSI)クラスタリングは、アノテーションなしで同様のピクセルを同じクラスに割り当てる。
既存のグラフニューラルネットワーク(GNN)は、入力されたHSIのスペクトル情報を十分に活用できない。
グラフ構造化HSIスーパーピクセルに適した構造スペクトルグラフ畳み込み演算子(SSGCO)を提案する。
論文 参考訳(メタデータ) (2025-06-11T16:41:34Z) - Towards Scalable Foundation Model for Multi-modal and Hyperspectral Geospatial Data [14.104497777255137]
本稿では,3つのイノベーションを取り入れた高効率空間スペクトル変換器について紹介する。
位置マスキングとチャネルマスキングを統合したHyperspectral Masked Autoencoderフレームワークを用いたLESS ViTの事前訓練を行った。
実験により, 提案手法は, 最先端のマルチモーダル地空間基盤モデルと競合する性能を示す。
論文 参考訳(メタデータ) (2025-03-17T05:42:19Z) - Cross-Scan Mamba with Masked Training for Robust Spectral Imaging [51.557804095896174]
本研究では,空間スペクトルSSMを用いたクロススキャンマンバ(CS-Mamba)を提案する。
実験の結果, CS-Mambaは最先端の性能を達成し, マスク付きトレーニング手法によりスムーズな特徴を再構築し, 視覚的品質を向上させることができた。
論文 参考訳(メタデータ) (2024-08-01T15:14:10Z) - Paving the way toward foundation models for irregular and unaligned Satellite Image Time Series [0.0]
衛星画像の空間的, スペクトル的, 時間的次元を考慮したALISEを提案する。
SITSで現在利用可能なSSLモデルとは異なり、ALISEはSITSを共通の学習された時間的プロジェクション空間に投影するための柔軟なクエリメカニズムを組み込んでいる。
PASTIS, 土地被覆区分 (MultiSenGE) , 新たな作物変化検出データセットの3つの下流課題を通じて, 生産された表現の質を評価する。
論文 参考訳(メタデータ) (2024-07-11T12:42:10Z) - HyperSIGMA: Hyperspectral Intelligence Comprehension Foundation Model [88.13261547704444]
Hyper SIGMAは、タスクやシーン間でHSI解釈を統合するビジョントランスフォーマーベースの基礎モデルである。
さらに,約450Kのハイパースペクトル画像を含む,事前学習のための大規模ハイパースペクトルデータセットHyperGlobal-450Kを構築した。
論文 参考訳(メタデータ) (2024-06-17T13:22:58Z) - A generic self-supervised learning (SSL) framework for representation
learning from spectra-spatial feature of unlabeled remote sensing imagery [4.397725469518669]
自己教師付き学習(SSL)では、モデルが桁違いに遅延のないデータから表現を学習することができる。
この研究は、未ラベルデータのスペクトル空間情報の両方から表現を学習できる新しいSSLフレームワークを設計した。
論文 参考訳(メタデータ) (2023-06-27T23:50:43Z) - CSP: Self-Supervised Contrastive Spatial Pre-Training for
Geospatial-Visual Representations [90.50864830038202]
ジオタグ付き画像の自己教師型学習フレームワークであるContrastive Spatial Pre-Training(CSP)を提案する。
デュアルエンコーダを用いて画像とその対応する位置情報を別々に符号化し、コントラスト目的を用いて画像から効果的な位置表現を学習する。
CSPは、様々なラベル付きトレーニングデータサンプリング比と10~34%の相対的な改善で、モデル性能を大幅に向上させる。
論文 参考訳(メタデータ) (2023-05-01T23:11:18Z) - Cross-Attention in Coupled Unmixing Nets for Unsupervised Hyperspectral
Super-Resolution [79.97180849505294]
本稿では,HSIの空間分解能を高めるために,CUCaNetというクロスアテンション機構を備えた新しい結合型アンミックスネットワークを提案する。
3つの広く使われているHS-MSデータセットに対して、最先端のHSI-SRモデルと比較実験を行った。
論文 参考訳(メタデータ) (2020-07-10T08:08:20Z) - X-ModalNet: A Semi-Supervised Deep Cross-Modal Network for
Classification of Remote Sensing Data [69.37597254841052]
我々はX-ModalNetと呼ばれる新しいクロスモーダルディープラーニングフレームワークを提案する。
X-ModalNetは、ネットワークの上部にある高レベルな特徴によって構築されたアップダスタブルグラフ上にラベルを伝搬するため、うまく一般化する。
我々は2つのマルチモーダルリモートセンシングデータセット(HSI-MSIとHSI-SAR)上でX-ModalNetを評価し、いくつかの最先端手法と比較して大幅に改善した。
論文 参考訳(メタデータ) (2020-06-24T15:29:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。