論文の概要: Temporal-Spectral-Spatial Unified Remote Sensing Dense Prediction
- arxiv url: http://arxiv.org/abs/2505.12280v1
- Date: Sun, 18 May 2025 07:39:17 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-20 14:57:11.139675
- Title: Temporal-Spectral-Spatial Unified Remote Sensing Dense Prediction
- Title(参考訳): 時間-スペクトル-空間-空間統合型リモートセンシング線量予測
- Authors: Sijie Zhao, Feng Liu, Xueliang Zhang, Hao Chen, Pengfeng Xiao, Lei Bai,
- Abstract要約: 本稿では,リモートセンシングデータの統一表現とモデリングを目的とした新しいアーキテクチャであるTSSUN(Temporal-Spectral-Spatial Unified Network)を紹介する。
複数のデータセットに対する大規模な実験により、単一のTSSUNモデルがヘテロジニアスな入力に効果的に適応し、様々な密集した予測タスクを統一することを示した。
- 参考スコア(独自算出の注目度): 21.891736845998707
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The proliferation of diverse remote sensing data has spurred advancements in dense prediction tasks, yet significant challenges remain in handling data heterogeneity. Remote sensing imagery exhibits substantial variability across temporal, spectral, and spatial (TSS) dimensions, complicating unified data processing. Current deep learning models for dense prediction tasks, such as semantic segmentation and change detection, are typically tailored to specific input-output configurations. Consequently, variations in data dimensionality or task requirements often lead to significant performance degradation or model incompatibility, necessitating costly retraining or fine-tuning efforts for different application scenarios. This paper introduces the Temporal-Spectral-Spatial Unified Network (TSSUN), a novel architecture designed for unified representation and modeling of remote sensing data across diverse TSS characteristics and task types. TSSUN employs a Temporal-Spectral-Spatial Unified Strategy that leverages meta-information to decouple and standardize input representations from varied temporal, spectral, and spatial configurations, and similarly unifies output structures for different dense prediction tasks and class numbers. Furthermore, a Local-Global Window Attention mechanism is proposed to efficiently capture both local contextual details and global dependencies, enhancing the model's adaptability and feature extraction capabilities. Extensive experiments on multiple datasets demonstrate that a single TSSUN model effectively adapts to heterogeneous inputs and unifies various dense prediction tasks. The proposed approach consistently achieves or surpasses state-of-the-art performance, highlighting its robustness and generalizability for complex remote sensing applications without requiring task-specific modifications.
- Abstract(参考訳): 多様なリモートセンシングデータの拡散は、密集した予測タスクの進歩を加速させたが、データの不均一性を扱う上では大きな課題が残っている。
リモートセンシング画像は、時間、スペクトル、空間(TSS)次元にかなりのばらつきを示し、統一されたデータ処理を複雑にする。
セマンティックセグメンテーションや変化検出といった高密度な予測タスクのための現在のディープラーニングモデルは、通常、特定の入力出力設定に合わせて調整される。
その結果、データディメンタリティやタスク要件のバリエーションは、しばしばパフォーマンスの大幅な低下やモデルの非互換性をもたらし、コストのかかる再トレーニングや、異なるアプリケーションシナリオのための微調整の作業を必要とします。
本稿では,TSSの特徴やタスクタイプにまたがるリモートセンシングデータの統一表現とモデリングを目的としたアーキテクチャであるTSSUN(Temporal-Spectral-Spatial Unified Network)を紹介する。
TSSUNは、メタ情報を利用して、様々な時間的、スペクトル的、空間的構成から入力表現を分離し標準化し、同様に様々な密集予測タスクとクラス番号の出力構造を統一する、時間-スペクトル-空間的統一戦略を採用している。
さらに、ローカル・グローバル・ウィンドウ・アテンション機構は、局所的なコンテキストの詳細とグローバルな依存関係の両方を効率的に捕捉し、モデルの適応性と特徴抽出能力を向上する。
複数のデータセットに対する大規模な実験により、単一のTSSUNモデルがヘテロジニアスな入力に効果的に適応し、様々な密集した予測タスクを統一することを示した。
提案手法は、タスク固有の変更を必要とせずに、複雑なリモートセンシングアプリケーションの堅牢性と一般化性を強調しながら、最先端のパフォーマンスを一貫して達成または超越する。
関連論文リスト
- STaRFormer: Semi-Supervised Task-Informed Representation Learning via Dynamic Attention-Based Regional Masking for Sequential Data [4.351581973358463]
トランスフォーマーベースのアプローチであるSTaRFormerは、シーケンシャルモデリングのための普遍的なフレームワークとして機能する。
STaRFormerは、動的注意に基づく領域マスキングスキームと半教師付きコントラスト学習を組み合わせて、タスク固有の潜在表現を強化する。
論文 参考訳(メタデータ) (2025-04-14T11:03:19Z) - UrbanSAM: Learning Invariance-Inspired Adapters for Segment Anything Models in Urban Construction [51.54946346023673]
都市形態は本質的に複雑で、様々な形状と様々なスケールの不規則な物体がある。
Segment Anything Model (SAM) は複雑なシーンのセグメンテーションにおいて大きな可能性を示している。
本研究では,複雑な都市環境の分析に特化して設計されたSAMのカスタマイズ版であるUrbanSAMを提案する。
論文 参考訳(メタデータ) (2025-02-21T04:25:19Z) - PolSAM: Polarimetric Scattering Mechanism Informed Segment Anything Model [76.95536611263356]
PolSARデータは、そのリッチで複雑な特徴のために、ユニークな課題を提示する。
複素数値データ、偏光特性、振幅画像などの既存のデータ表現が広く使われている。
PolSARのほとんどの機能抽出ネットワークは小さく、機能を効果的にキャプチャする能力を制限している。
本稿では,ドメイン固有の散乱特性と新規なプロンプト生成戦略を統合したSegment Anything Model (SAM) であるPolarimetric Scattering Mechanism-Informed SAM (PolSAM)を提案する。
論文 参考訳(メタデータ) (2024-12-17T09:59:53Z) - Transforming Multidimensional Time Series into Interpretable Event Sequences for Advanced Data Mining [5.2863523790908955]
本稿では,多次元時系列解析における従来の手法の限界に対処する新しい表現モデルを提案する。
提案するフレームワークは,ITインフラの監視と最適化,継続的な患者モニタリングによる診断,トレンド分析,インターネットビジネスによるユーザ行動の追跡,予測など,さまざまな分野のアプリケーションに対して大きな可能性を秘めている。
論文 参考訳(メタデータ) (2024-09-22T06:27:07Z) - TimeDiT: General-purpose Diffusion Transformers for Time Series Foundation Model [11.281386703572842]
TimeDiTは時間依存性学習と確率的サンプリングを組み合わせた拡散トランスフォーマーモデルである。
TimeDiTは、さまざまなタスクにわたるトレーニングと推論プロセスを調和させるために、統一的なマスキングメカニズムを採用している。
我々の体系的評価は、ゼロショット/ファインチューニングによる予測と計算という基本的なタスクにおいて、TimeDiTの有効性を示す。
論文 参考訳(メタデータ) (2024-09-03T22:31:57Z) - Paving the way toward foundation models for irregular and unaligned Satellite Image Time Series [0.0]
衛星画像の空間的, スペクトル的, 時間的次元を考慮したALISEを提案する。
SITSで現在利用可能なSSLモデルとは異なり、ALISEはSITSを共通の学習された時間的プロジェクション空間に投影するための柔軟なクエリメカニズムを組み込んでいる。
PASTIS, 土地被覆区分 (MultiSenGE) , 新たな作物変化検出データセットの3つの下流課題を通じて, 生産された表現の質を評価する。
論文 参考訳(メタデータ) (2024-07-11T12:42:10Z) - RGM: A Robust Generalizable Matching Model [49.60975442871967]
RGM(Robust Generalist Matching)と呼ばれる疎密マッチングのための深部モデルを提案する。
合成トレーニングサンプルと実世界のシナリオのギャップを狭めるために、我々は、疎対応基盤真理を持つ新しい大規模データセットを構築した。
さまざまな密集したスパースなデータセットを混ぜ合わせることができ、トレーニングの多様性を大幅に改善しています。
論文 参考訳(メタデータ) (2023-10-18T07:30:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。