論文の概要: COP-GEN: Latent Diffusion Transformer for Copernicus Earth Observation Data -- Generation Stochastic by Design
- arxiv url: http://arxiv.org/abs/2603.03239v1
- Date: Tue, 03 Mar 2026 18:31:46 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-04 21:38:10.928734
- Title: COP-GEN: Latent Diffusion Transformer for Copernicus Earth Observation Data -- Generation Stochastic by Design
- Title(参考訳): COP-GEN:コペルニクス地球観測データのための潜時拡散変換器 --設計による確率生成
- Authors: Miguel Espinosa, Eva Gmelich Meijling, Valerio Marsocci, Elliot J. Crowley, Mikolaj Czerkawski,
- Abstract要約: 地球観測の応用は、光学、レーダー、標高、土地被覆製品を含む複数のセンサーのデータにますます依存している。
本研究では,不均一な地球観測モードの空間分解能の共分散をモデルとした潜時拡散変換器COP-GENを紹介する。
大規模なグローバルマルチモーダルデータセットの実験では、COP-GENは光学、レーダー、高度のモードで強いピーク忠実性を維持しながら、多種多様な物理的に一貫した実現を生成する。
- 参考スコア(独自算出の注目度): 9.278432103577925
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Earth observation applications increasingly rely on data from multiple sensors, including optical, radar, elevation, and land-cover products. Relationships between these modalities are fundamental for data integration but are inherently non-injective: identical conditioning information can correspond to multiple physically plausible observations. Thus, such conditional mappings should be parametrised as data distributions. As a result, deterministic models tend to collapse toward conditional means and fail to represent the uncertainty and variability required for tasks such as data completion and cross-sensor translation. We introduce COP-GEN, a multimodal latent diffusion transformer that models the joint distribution of heterogeneous Earth Observation modalities at their native spatial resolutions. By parameterising cross-modal mappings as conditional distributions, COP-GEN enables flexible any-to-any conditional generation, including zero-shot modality translation, spectral band infilling, and generation under partial or missing inputs, without task-specific retraining. Experiments on a large-scale global multimodal dataset show that COP-GEN generates diverse yet physically consistent realisations while maintaining strong peak fidelity across optical, radar, and elevation modalities. Qualitative and quantitative analyses demonstrate that the model captures meaningful cross-modal structure and systematically adapts its output uncertainty as conditioning information increases. These results highlight the practical importance of stochastic generative modeling for Earth observation and motivate evaluation protocols that move beyond single-reference, pointwise metrics. Website: https:// miquel-espinosa.github.io/cop-gen
- Abstract(参考訳): 地球観測の応用は、光学、レーダー、標高、土地被覆製品を含む複数のセンサーのデータにますます依存している。
これらのモダリティ間の関係は、データ統合には基本的なものであるが、本質的には非インジェクティブである:同じ条件付け情報は、複数の物理的に妥当な観測に対応することができる。
したがって、そのような条件付き写像はデータ分布としてパラメータ化されるべきである。
その結果、決定論的モデルは条件付き手段に向かって崩壊し、データ補完やクロスセンサー翻訳といったタスクに必要な不確実性や変動を表現できない傾向にある。
本研究では,不均一な地球観測モードの空間分解能の共分散をモデル化した多モード潜時拡散変換器COP-GENを紹介する。
条件分布としてクロスモーダルマッピングをパラメータ化することにより、COP-GENは、タスク固有のリトレーニングなしで、ゼロショットモダリティ変換、スペクトルバンドのインフィル、部分的または欠落した入力による生成を含む、フレキシブルな任意の条件生成を可能にする。
大規模なグローバルマルチモーダルデータセットの実験では、COP-GENは光学、レーダー、高度のモードで強いピーク忠実性を維持しながら、多種多様な物理的に一貫した実現を生成する。
定性的かつ定量的な分析により、モデルは意味のあるクロスモーダル構造を捕捉し、条件付け情報が増加するにつれて出力の不確実性に体系的に適応することを示した。
これらの結果は、地球観測のための確率的生成モデリングの実践的重要性を浮き彫りにした。
ウェブサイト:https://miquel-espinosa.github.io/cop-gen
関連論文リスト
- GeodesicNVS: Probability Density Geodesic Flow Matching for Novel View Synthesis [54.39598154430305]
本稿では,ペアビュー間の決定論的変換を直接学習するデータ間フローマッチングフレームワークを提案する。
PDG-FMは、事前訓練された拡散モデルの確率密度測定値から導かれる測地的補間剤を用いて流れの軌跡を制約する。
これらの結果は、一貫した新しいビュー生成のための決定論的フローマッチングにデータ依存の幾何正規化を組み込むことの利点を強調している。
論文 参考訳(メタデータ) (2026-03-01T09:30:11Z) - Leveraging generative adversarial networks with spatially adaptive denormalization for multivariate stochastic seismic data inversion [0.0]
本研究では,地震データから相の予測と複数の相関した連続特性を示す反復的測地逆解析アルゴリズムSPADE-GANInvを提案する。
SPADE-GANは現実的なジオメトリを再現するように訓練され、シーケンシャルなコシミュレーションは相依存性の連続特性の空間的変動を予測する。
本手法は2次元合成シナリオとフィールドデータの両方で実証され, フルスタック地震データからフェーシ, ポロシティ, 音響インピーダンスの予測を目標としている。
論文 参考訳(メタデータ) (2025-12-02T15:25:22Z) - Spatial-Temporal-Spectral Unified Modeling for Remote Sensing Dense Prediction [20.1863553357121]
リモートセンシングのための現在のディープラーニングアーキテクチャは、基本的に堅固である。
本稿では,統合モデリングのための空間時間スペクトル統一ネットワーク(STSUN)について紹介する。
STSUNは任意の空間サイズ、時間長、スペクトル帯域で入力および出力データに適応することができる。
様々な密集した予測タスクと多様な意味クラス予測を統一する。
論文 参考訳(メタデータ) (2025-05-18T07:39:17Z) - Language-Informed Hyperspectral Image Synthesis for Imbalanced-Small Sample Classification via Semi-Supervised Conditional Diffusion Model [1.9746060146273674]
本稿では,新しい言語インフォームドハイパースペクトル画像合成法であるTxt2HSI-LDM(VAE)を提案する。
ハイパースペクトルデータの高次元性に対処するため、普遍変分オートエンコーダ(VAE)は、データを低次元の潜在空間にマッピングするように設計されている。
VAEは、拡散モデルによって生成された潜時空間から言語条件を入力としてHSIをデコードする。
論文 参考訳(メタデータ) (2025-02-27T02:35:49Z) - PolSAM: Polarimetric Scattering Mechanism Informed Segment Anything Model [83.35198885088093]
PolSARデータは、そのリッチで複雑な特徴のために、ユニークな課題を提示する。
複素数値データ、偏光特性、振幅画像などの既存のデータ表現が広く使われている。
PolSARのほとんどの機能抽出ネットワークは小さく、機能を効果的にキャプチャする能力を制限している。
本稿では,ドメイン固有の散乱特性と新規なプロンプト生成戦略を統合したSegment Anything Model (SAM) であるPolarimetric Scattering Mechanism-Informed SAM (PolSAM)を提案する。
論文 参考訳(メタデータ) (2024-12-17T09:59:53Z) - Energy-Based Modelling for Discrete and Mixed Data via Heat Equations on Structured Spaces [19.92604781654767]
エネルギーベースモデル(EBM)は、様々なデータドメインにわたる確率的モデリングのための柔軟なフレームワークを提供する。
本稿では,データポイントにおけるエネルギー関数の評価のみを必要とする損失関数であるEnergy Discrepancyを用いた個別ESMの訓練を提案する。
論文 参考訳(メタデータ) (2024-12-02T00:35:29Z) - Synthetic location trajectory generation using categorical diffusion
models [50.809683239937584]
拡散モデル(DPM)は急速に進化し、合成データのシミュレーションにおける主要な生成モデルの一つとなっている。
本稿では,個人が訪れた物理的位置を表す変数列である合成個別位置軌跡(ILT)の生成にDPMを用いることを提案する。
論文 参考訳(メタデータ) (2024-02-19T15:57:39Z) - Learning transformer-based heterogeneously salient graph representation for multimodal remote sensing image classification [42.15709954199397]
本稿では,変圧器を用いたヘテロジニアサリエントグラフ表現法(THSGR)を提案する。
まず、多モード不均一グラフエンコーダを用いて、非ユークリッド構造の特徴を異種データから符号化する。
自己アテンションフリーなマルチ畳み込み変調器は、効果的かつ効率的な長期依存性モデリングのために設計されている。
論文 参考訳(メタデータ) (2023-11-17T04:06:20Z) - VTAE: Variational Transformer Autoencoder with Manifolds Learning [144.0546653941249]
深層生成モデルは、多くの潜伏変数を通して非線形データ分布の学習に成功している。
ジェネレータの非線形性は、潜在空間がデータ空間の不満足な射影を示し、表現学習が不十分になることを意味する。
本研究では、測地学と正確な計算により、深部生成モデルの性能を大幅に向上させることができることを示す。
論文 参考訳(メタデータ) (2023-04-03T13:13:19Z) - DIFFormer: Scalable (Graph) Transformers Induced by Energy Constrained
Diffusion [66.21290235237808]
本稿では,データセットからのインスタンスのバッチを進化状態にエンコードするエネルギー制約拡散モデルを提案する。
任意のインスタンス対間の対拡散強度に対する閉形式最適推定を示唆する厳密な理論を提供する。
各種タスクにおいて優れた性能を有する汎用エンコーダバックボーンとして,本モデルの適用性を示す実験を行った。
論文 参考訳(メタデータ) (2023-01-23T15:18:54Z) - OR-Net: Pointwise Relational Inference for Data Completion under Partial
Observation [51.083573770706636]
この作業はリレーショナル推論を使って不完全なデータを埋めます。
本稿では,2つの点での相対性理論をモデル化するために,全関係ネットワーク (or-net) を提案する。
論文 参考訳(メタデータ) (2021-05-02T06:05:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。