論文の概要: Sat-JEPA-Diff: Bridging Self-Supervised Learning and Generative Diffusion for Remote Sensing
- arxiv url: http://arxiv.org/abs/2603.13943v1
- Date: Sat, 14 Mar 2026 13:30:49 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-17 16:19:35.499639
- Title: Sat-JEPA-Diff: Bridging Self-Supervised Learning and Generative Diffusion for Remote Sensing
- Title(参考訳): Sat-JEPA-Diff:遠隔センシングのための自己監督型学習と生成拡散
- Authors: Kursat Komurcu, Linas Petkevicius,
- Abstract要約: Sat-JEPA-Diffは自己監督学習(SSL)と隠れ拡散モデル(LDM)を組み合わせる
IJEPAモジュールは安定したセマンティック表現を予測し、凍結した安定拡散バックボーンを軽量なクロスアテンションアダプタを介してルーティングする。
グローバルなSentinel-2データセットに基づいて評価されたSat-JEPA-Diffは、シャープな境界の解決に優れている。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Predicting satellite imagery requires a balance between structural accuracy and textural detail. Standard deterministic methods like PredRNN or SimVP minimize pixel-based errors but suffer from the "regression to the mean" problem, producing blurry outputs that obscure subtle geographic-spatial features. Generative models provide realistic textures but often misleadingly reveal structural anomalies. To bridge this gap, we introduce Sat-JEPA-Diff, which combines Self-Supervised Learning (SSL) with Hidden Diffusion Models (LDM). An IJEPA module predicts stable semantic representations, which then route a frozen Stable Diffusion backbone via a lightweight cross-attention adapter. This ensures that the synthesized high-accuracy textures are based on absolutely accurate structural predictions. Evaluated on a global Sentinel-2 dataset, Sat-JEPA-Diff excels at resolving sharp boundaries. It achieves leading perceptual scores (GSSIM: 0.8984, FID: 0.1475) and significantly outperforms deterministic baselines, despite standard autoregressive stability limits. The code and dataset are publicly available on https://github.com/VU-AIML/SAT-JEPA-DIFF.
- Abstract(参考訳): 衛星画像の予測には、構造精度とテクスチュラルディテールのバランスが必要である。
PredRNNやSimVPのような標準的な決定論的手法はピクセルベースの誤りを最小限に抑えるが、「平均への回帰」問題に悩まされ、微妙な地理的空間的特徴を持つぼやけた出力を生成する。
生成モデルは現実的なテクスチャを提供するが、しばしば誤解を招く構造上の異常を明らかにする。
このギャップを埋めるために、自己監視学習(SSL)と隠れ拡散モデル(LDM)を組み合わせたSat-JEPA-Diffを導入する。
IJEPAモジュールは安定したセマンティック表現を予測し、凍結した安定拡散バックボーンを軽量なクロスアテンションアダプタを介してルーティングする。
これにより、合成された高精度なテクスチャが、完全に正確な構造予測に基づいていることが保証される。
グローバルなSentinel-2データセットに基づいて評価されたSat-JEPA-Diffは、シャープな境界の解決に優れている。
主要な知覚スコア(GSSIM: 0.8984, FID: 0.1475)を達成し、標準自己回帰安定性の限界にもかかわらず決定論的ベースラインを著しく上回る。
コードとデータセットはhttps://github.com/VU-AIML/SAT-JEPA-DIFFで公開されている。
関連論文リスト
- LEPA: Learning Geometric Equivariance in Satellite Remote Sensing Data with a Predictive Architecture [2.618539394367099]
本稿では,大規模な衛星リモートセンシングデータに対する埋め込み予測のための新しいアーキテクチャを提案する。
平均化の代わりに、EPAはNASA/USGSランドサット・センチネル(HLS)画像とLNetイメージ0.8kを直接予測するために埋め込みに潜伏している。
論文 参考訳(メタデータ) (2026-03-07T14:56:15Z) - Noise-Robust Tiny Object Localization with Flows [63.60972031108944]
フレキシブルなエラーモデリングと不確実性誘導最適化に正規化フローを活用するノイズローバストローカライゼーションフレームワークを提案する。
本手法は,フローベース誤差モデルを用いて,複雑な非ガウス予測分布を抽出し,ノイズの多い監視下で頑健な学習を可能にする。
不確実性を考慮した勾配変調機構は、トレーニングを安定化しながら過度な適合を緩和し、高不確実でノイズの強いサンプルからの学習をさらに抑制する。
論文 参考訳(メタデータ) (2026-01-02T09:16:55Z) - Coarse-to-Fine Hierarchical Alignment for UAV-based Human Detection using Diffusion Models [14.696438400081114]
本稿では,UAVに基づく人体検出のための合成データを変換するための3段階拡散型フレームワークを提案する。
Cwdはグローバルなスタイルとローカルなコンテンツドメインの相違を明確に分離し、3つのモジュールを使ってそれらのギャップを埋める。
提案手法は,Semantic-DroneベンチマークでmAP50を最大14.1ドルで改善する。
論文 参考訳(メタデータ) (2025-12-15T19:57:36Z) - Multi-modal Loop Closure Detection with Foundation Models in Severely Unstructured Environments [10.028232479762075]
本稿では,マルチモーダルパイプラインであるMPRFについて述べる。
S3LIデータセットとS3LI Vulcanoデータセットの実験は、MPRFが最先端の検索方法よりも精度が高いことを示している。
SLAMバックエンドに適した解釈可能な対応を提供することにより、MPRFは精度、効率、信頼性の間の良好なトレードオフを達成する。
論文 参考訳(メタデータ) (2025-11-07T16:30:35Z) - Diff-GNSS: Diffusion-based Pseudorange Error Estimation [4.275603853123926]
グローバル・ナビゲーション・サテライト・システムズ(GNSS)は、信頼できる都市の位置決めに不可欠である。
マルチパスと非線形受信は、しばしば精度を低下させる大きな測定誤差をもたらす。
擬似乱数誤差を予測・補償する学習手法が注目されているが,その性能は複雑な誤差分布によって制限されている。
Diff-GNSSは,条件付き拡散モデルを用いて複雑な分布を捕捉する粗粒度測定(擬似サテライト)の誤差推定フレームワークである。
論文 参考訳(メタデータ) (2025-09-22T06:57:06Z) - OPUS: Occupancy Prediction Using a Sparse Set [64.60854562502523]
学習可能なクエリの集合を用いて、占有された場所とクラスを同時に予測するフレームワークを提案する。
OPUSには、モデルパフォーマンスを高めるための非自明な戦略が組み込まれている。
最も軽量なモデルではOcc3D-nuScenesデータセットの2倍 FPS に優れたRayIoUが得られる一方、最も重いモデルは6.1 RayIoUを上回ります。
論文 参考訳(メタデータ) (2024-09-14T07:44:22Z) - SIRST-5K: Exploring Massive Negatives Synthesis with Self-supervised
Learning for Robust Infrared Small Target Detection [53.19618419772467]
単一フレーム赤外線小ターゲット検出(SIRST)は、乱雑な背景から小さなターゲットを認識することを目的としている。
Transformerの開発に伴い、SIRSTモデルのスケールは常に増大している。
赤外線小ターゲットデータの多彩な多様性により,本アルゴリズムはモデル性能と収束速度を大幅に改善する。
論文 参考訳(メタデータ) (2024-03-08T16:14:54Z) - False: False Negative Samples Aware Contrastive Learning for Semantic
Segmentation of High-Resolution Remote Sensing Image [11.356381535900901]
高分解能RSIのセマンティックセグメンテーションのためのFalse negAtive sampLes aware contraStive lEarning model (FALSE)を提案する。
SSCL事前訓練は監督されないため、偽陰性サンプル(FNS)の判定可能な基準の欠如は理論的不確定性をもたらす。
我々は、FNS自己決定戦略によるFNSの粗い決定を達成し、FNS信頼度補正(FNCC)損失関数によるFNSの校正を実現する。
論文 参考訳(メタデータ) (2022-11-15T06:24:26Z) - Bridging the Gap Between Clean Data Training and Real-World Inference
for Spoken Language Understanding [76.89426311082927]
既存のモデルはクリーンデータに基づいてトレーニングされ、クリーンデータトレーニングと現実世界の推論の間にtextitgapが発生する。
本稿では,良質なサンプルと低品質のサンプルの両方が類似ベクトル空間に埋め込まれた領域適応法を提案する。
広く使用されているデータセット、スニップス、および大規模な社内データセット(1000万のトレーニング例)に関する実験では、この方法は実世界の(騒々しい)コーパスのベースラインモデルを上回るだけでなく、堅牢性、すなわち、騒々しい環境下で高品質の結果を生み出すことを実証しています。
論文 参考訳(メタデータ) (2021-04-13T17:54:33Z) - Uncertainty Estimation Using a Single Deep Deterministic Neural Network [66.26231423824089]
本稿では,1回のフォワードパスで,テスト時に分布データポイントの発見と拒否が可能な決定論的ディープモデルを訓練する手法を提案する。
我々は,新しい損失関数とセントロイド更新方式を用いて,これらをスケールトレーニングし,ソフトマックスモデルの精度に適合させる。
論文 参考訳(メタデータ) (2020-03-04T12:27:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。