論文の概要: A Decade of Deep Learning for Remote Sensing Spatiotemporal Fusion: Advances, Challenges, and Opportunities
- arxiv url: http://arxiv.org/abs/2504.00901v2
- Date: Fri, 11 Jul 2025 11:18:07 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-14 14:01:05.376026
- Title: A Decade of Deep Learning for Remote Sensing Spatiotemporal Fusion: Advances, Challenges, and Opportunities
- Title(参考訳): リモートセンシング時空間融合のための深層学習の10年 : 進歩・課題・機会
- Authors: Enzhe Sun, Yongchuan Cui, Peng Liu, Jining Yan,
- Abstract要約: 本稿では,過去10年間のリモートセンシングSTFにおけるディープラーニングの進歩に関する包括的調査について紹介する。
我々は,CNN,トランスフォーマー,GAN(Generative Adrial Networks),拡散モデル,シーケンスモデルなど,ディープラーニングアーキテクチャの分類を確立した。
時間空間の衝突、データセット間の一般化、大規模処理の計算効率、マルチソース異種融合、ベンチマークの多様性の不足といった5つの重要な課題を特定した。
- 参考スコア(独自算出の注目度): 2.2311172523629637
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Remote sensing spatiotemporal fusion (STF) addresses the fundamental trade-off between temporal and spatial resolution by combining high temporal-low spatial and high spatial-low temporal imagery. This paper presents the first comprehensive survey of deep learning advances in remote sensing STF over the past decade. We establish a systematic taxonomy of deep learning architectures including Convolutional Neural Networks (CNNs), Transformers, Generative Adversarial Networks (GANs), diffusion models, and sequence models, revealing significant growth in deep learning adoption for STF tasks. Our analysis reveals that CNN-based methods dominate spatial feature extraction, while Transformer architectures show superior performance in capturing long-range temporal dependencies. GAN and diffusion models demonstrate exceptional capability in detail reconstruction, substantially outperforming traditional methods in structural similarity and spectral fidelity. Through comprehensive experiments on seven benchmark datasets comparing ten representative methods, we validate these findings and quantify the performance trade-offs between different approaches. We identify five critical challenges: time-space conflicts, limited generalization across datasets, computational efficiency for large-scale processing, multi-source heterogeneous fusion, and insufficient benchmark diversity. The survey highlights promising opportunities in foundation models, hybrid architectures, and self-supervised learning approaches that could address current limitations and enable multimodal applications. The specific models, datasets, and other information mentioned in this article have been collected in: https://github.com/yc-cui/Deep-Learning-Spatiotemporal-Fusion-Survey.
- Abstract(参考訳): リモートセンシング時空間融合(STF)は、時間分解能と空間分解能の基本的なトレードオフに、高時間分解能と高空間分解能の時間分解能を組み合わせることで対処する。
本稿では,過去10年間のリモートセンシングSTFにおけるディープラーニングの進歩に関する包括的調査について紹介する。
我々は、畳み込みニューラルネットワーク(CNN)、トランスフォーマー(Transformers)、ジェネレーティブ・アドバイサル・ネットワーク(Generative Adversarial Networks、GAN)、拡散モデル、シーケンスモデルなど、ディープラーニングアーキテクチャの体系的な分類を確立し、STFタスクにおけるディープラーニングの採用の著しい増加を明らかにした。
解析の結果,CNNに基づく手法が空間的特徴抽出を支配していることが明らかとなった。
GANと拡散モデルは、微細な再構成において例外的な能力を示し、構造的類似性やスペクトルの忠実性において従来の手法を大幅に上回っている。
10の代表的な手法を比較した7つのベンチマークデータセットに関する総合的な実験を通じて、これらの知見を検証し、異なるアプローチ間の性能トレードオフを定量化する。
時間空間の衝突、データセット間の一般化の制限、大規模処理の計算効率、マルチソース異種融合、ベンチマークの多様性の不足といった5つの重要な課題を特定した。
この調査は、ファンデーションモデル、ハイブリッドアーキテクチャ、そして現在の制限に対処しマルチモーダルアプリケーションを可能にする自己教師付き学習アプローチにおける有望な機会を強調している。
この記事で言及されている具体的なモデル、データセット、その他の情報は、https://github.com/yc-cui/Deep-Learning-Spatiotemporal-Fusion-Surveyで収集されている。
関連論文リスト
- CAST: Cross-Attentive Spatio-Temporal feature fusion for Deepfake detection [0.0]
CNNは空間的アーティファクトのキャプチャに有効であり、Transformerは時間的不整合のモデリングに優れている。
本稿では,空間的特徴と時間的特徴を効果的に融合させるために,クロスアテンションを利用した統合CASTモデルを提案する。
我々はFaceForensics++、Celeb-DF、DeepfakeDetectionデータセットを用いてモデルの性能を評価する。
論文 参考訳(メタデータ) (2025-06-26T18:51:17Z) - Multivariate Long-term Time Series Forecasting with Fourier Neural Filter [55.09326865401653]
我々はFNFをバックボーンとして、DBDをアーキテクチャとして導入し、空間時間モデルのための優れた学習能力と最適な学習経路を提供する。
FNFは、局所時間領域とグローバル周波数領域の情報処理を単一のバックボーン内で統合し、空間的モデリングに自然に拡張することを示す。
論文 参考訳(メタデータ) (2025-06-10T18:40:20Z) - UniSTD: Towards Unified Spatio-Temporal Learning across Diverse Disciplines [64.84631333071728]
本稿では,時間的モデリングのためのトランスフォーマーベースの統合フレームワークであるbfUnistageを紹介する。
我々の研究は、タスク固有の視覚テキストが時間学習のための一般化可能なモデルを構築することができることを示した。
また、時間的ダイナミクスを明示的に組み込むための時間的モジュールも導入する。
論文 参考訳(メタデータ) (2025-03-26T17:33:23Z) - Deep Learning for Spatio-Temporal Fusion in Land Surface Temperature Estimation: A Comprehensive Survey, Experimental Analysis, and Future Trends [3.344876133162209]
地表面温度(LST)は重要な環境過程を理解する上で重要な役割を果たしている。
衛星センサーはしばしば空間分解能と時間分解能のトレードオフに直面している。
時空間融合(STF)は、2つの衛星データソースを統合する強力な方法として登場した。
論文 参考訳(メタデータ) (2024-12-21T13:53:15Z) - Higher-order Cross-structural Embedding Model for Time Series Analysis [12.35149125898563]
時系列分析は、医療、金融、センサーネットワークといった様々な分野における重要な応用のために、注目されている。
現在のアプローチでは、時系列内の高次相互作用をモデル化し、時間的あるいは空間的依存関係を別々に学習することに注力しています。
本稿では,時間的視点と空間的視点の両方を協調的にモデル化する新しいフレームワークであるHigh-TS(Higher-order Cross-structural Embedding Model for Time Series)を提案する。
論文 参考訳(メタデータ) (2024-10-30T12:51:14Z) - A Comprehensive Survey of Deep Learning for Time Series Forecasting: Architectural Diversity and Open Challenges [37.20655606514617]
時系列予測は意思決定の重要な情報を提供する重要なタスクである。
近年の研究では、単純な線形層のような代替手段がトランスフォーマーより優れていることが示されている。
論文 参考訳(メタデータ) (2024-10-24T07:43:55Z) - Foundation Models for Remote Sensing and Earth Observation: A Survey [101.77425018347557]
本調査は、リモートセンシング基礎モデル(RSFM)の新しい分野を体系的にレビューする。
モチベーションと背景の概要から始まり、続いて基本概念が導入された。
我々はこれらのモデルを公開データセットと比較し、既存の課題について議論し、今後の研究方向性を提案する。
論文 参考訳(メタデータ) (2024-10-22T01:08:21Z) - State-Space Modeling in Long Sequence Processing: A Survey on Recurrence in the Transformer Era [59.279784235147254]
このサーベイは、シーケンシャルなデータ処理の反復モデルに基づく最新のアプローチの詳細な概要を提供する。
新たなイメージは、標準のバックプロパゲーション・オブ・タイムから外れた学習アルゴリズムによって構成される、新しいルートを考える余地があることを示唆している。
論文 参考訳(メタデータ) (2024-06-13T12:51:22Z) - SFANet: Spatial-Frequency Attention Network for Weather Forecasting [54.470205739015434]
天気予報は様々な分野において重要な役割を担い、意思決定とリスク管理を推進している。
伝統的な手法は、しばしば気象系の複雑な力学を捉えるのに苦労する。
本稿では,これらの課題に対処し,天気予報の精度を高めるための新しい枠組みを提案する。
論文 参考訳(メタデータ) (2024-05-29T08:00:15Z) - Time Travelling Pixels: Bitemporal Features Integration with Foundation
Model for Remote Sensing Image Change Detection [28.40070234949818]
Time Travelling Pixels (TTP)は、潜在知識基盤モデルを変更検出に統合する新しいアプローチである。
LEVIR-CDで得られた最先端の成績は,TTPの有効性を裏付けるものであった。
論文 参考訳(メタデータ) (2023-12-23T08:56:52Z) - GATGPT: A Pre-trained Large Language Model with Graph Attention Network
for Spatiotemporal Imputation [19.371155159744934]
実世界の環境では、センサーの故障やデータ転送エラーなどの問題により、そのようなデータには欠落する要素がしばしば含まれる。
時間的計算の目的は、観測された時系列における固有の空間的および時間的関係を理解することによって、これらの欠落値を推定することである。
伝統的に、複雑な時間的計算は特定のアーキテクチャに依存しており、適用可能性の制限と高い計算複雑性に悩まされている。
対照的に、我々のアプローチは、事前訓練された大規模言語モデル(LLM)を複雑な時間的インプットに統合し、画期的なフレームワークであるGATGPTを導入している。
論文 参考訳(メタデータ) (2023-11-24T08:15:11Z) - Deep Learning for Spatiotemporal Big Data: A Vision on Opportunities and
Challenges [4.497634148674422]
一時的ビッグデータは、これまで不可能だった問題を解決する新たな機会を育むことができる。
ビッグデータの特徴は、ディープラーニング技術に新たな課題をもたらす。
論文 参考訳(メタデータ) (2023-10-30T19:12:51Z) - Remote Sensing Object Detection Meets Deep Learning: A Meta-review of
Challenges and Advances [51.70835702029498]
本稿では,ディープラーニングに基づくRSOD手法の最近の成果を概観する。
RSODの主な課題として,マルチスケールオブジェクト検出,回転オブジェクト検出,弱いオブジェクト検出,小さなオブジェクト検出,限られた監視を伴うオブジェクト検出の5つを挙げる。
また、RSODの分野で広く使用されているベンチマークデータセットと評価指標、およびRSODのアプリケーションシナリオについてもレビューする。
論文 参考訳(メタデータ) (2023-09-13T06:48:32Z) - Semantic Segmentation of Vegetation in Remote Sensing Imagery Using Deep
Learning [77.34726150561087]
本稿では,公開されているリモートセンシングデータからなるマルチモーダル・大規模時間データセットを作成するためのアプローチを提案する。
我々は、異なる種類の植生を分離できる畳み込みニューラルネットワーク(CNN)モデルを使用する。
論文 参考訳(メタデータ) (2022-09-28T18:51:59Z) - Tensor Decompositions for Hyperspectral Data Processing in Remote
Sensing: A Comprehensive Review [85.36368666877412]
ハイパースペクトル(HS)リモートセンシング(RS)イメージングは、地球表面の観測と分析のためにかなりの量の空間的およびスペクトル的情報を提供している。
近年のHS RS技術の進歩と革命は、様々な応用の可能性を実現する機会を与えている。
3次元HS固有の構造が維持されているため、テンソル分解はHSデータ処理タスクにおける幅広い関心や研究を引き起こしている。
論文 参考訳(メタデータ) (2022-05-13T00:39:23Z) - Deep Learning in Multimodal Remote Sensing Data Fusion: A Comprehensive
Review [33.40031994803646]
本調査は,DLに基づくマルチモーダルRSデータ融合の体系的概要を示すことを目的としている。
マルチモーダルRSデータ融合におけるサブフィールドについて,to-be-fusedデータモダリティの観点から検討する。
残る課題と今後の方向性が強調される。
論文 参考訳(メタデータ) (2022-05-03T09:08:16Z) - Supporting Optimal Phase Space Reconstructions Using Neural Network
Architecture for Time Series Modeling [68.8204255655161]
位相空間特性を暗黙的に学習する機構を持つ人工ニューラルネットワークを提案する。
私たちのアプローチは、ほとんどの最先端戦略と同じくらいの競争力があるか、あるいは優れているかのどちらかです。
論文 参考訳(メタデータ) (2020-06-19T21:04:47Z) - Spatiotemporal Fusion in 3D CNNs: A Probabilistic View [129.84064609199663]
そこで我々は,時間的融合戦略の成功を確率に変換することを提案する。これにより,個別に訓練することなく,様々な融合戦略のネットワークレベルの評価を行うことができる。
本手法は時間融合解析の効率を大幅に向上させる。
我々は4つの精密な行動認識データセット上で最先端の性能を達成するための新たな融合戦略を生成する。
論文 参考訳(メタデータ) (2020-04-10T10:40:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。