論文の概要: Morphing Through Time: Diffusion-Based Bridging of Temporal Gaps for Robust Alignment in Change Detection
- arxiv url: http://arxiv.org/abs/2511.07976v1
- Date: Wed, 12 Nov 2025 01:32:01 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-12 20:17:03.576136
- Title: Morphing Through Time: Diffusion-Based Bridging of Temporal Gaps for Robust Alignment in Change Detection
- Title(参考訳): 時間的モーフィング:変化検出におけるロバストアライメントのための拡散に基づく時間的ギャップのブリッジ
- Authors: Seyedehanita Madani, Vishal M. Patel,
- Abstract要約: 既存の変更検出ネットワークを変更することなく空間的・時間的ロバスト性を改善するモジュールパイプラインを導入する。
拡散モジュールは、大きな外観ギャップをブリッジする中間変形フレームを合成し、RoMaは段階的に対応を推定できる。
LEVIR-CD、WHU-CD、DSIFN-CDの実験は、登録精度と下流変化検出の両方において一貫した利得を示した。
- 参考スコア(独自算出の注目度): 51.56484100374058
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Remote sensing change detection is often challenged by spatial misalignment between bi-temporal images, especially when acquisitions are separated by long seasonal or multi-year gaps. While modern convolutional and transformer-based models perform well on aligned data, their reliance on precise co-registration limits their robustness in real-world conditions. Existing joint registration-detection frameworks typically require retraining and transfer poorly across domains. We introduce a modular pipeline that improves spatial and temporal robustness without altering existing change detection networks. The framework integrates diffusion-based semantic morphing, dense registration, and residual flow refinement. A diffusion module synthesizes intermediate morphing frames that bridge large appearance gaps, enabling RoMa to estimate stepwise correspondences between consecutive frames. The composed flow is then refined through a lightweight U-Net to produce a high-fidelity warp that co-registers the original image pair. Extensive experiments on LEVIR-CD, WHU-CD, and DSIFN-CD show consistent gains in both registration accuracy and downstream change detection across multiple backbones, demonstrating the generality and effectiveness of the proposed approach.
- Abstract(参考訳): リモートセンシング変化検出は、特に長期の季節差や複数年間隔で取得が分離された場合、両時間画像間の空間的不整合によってしばしば挑戦される。
現代の畳み込みモデルと変圧器ベースのモデルは整列データでよく機能するが、正確な共存に依存しているため、実世界の条件下では頑丈さが制限される。
既存の統合登録検出フレームワークでは、ドメイン間でのトレーニングや転送が貧弱であるのが一般的である。
既存の変更検出ネットワークを変更することなく空間的・時間的ロバスト性を改善するモジュールパイプラインを導入する。
このフレームワークは拡散に基づくセマンティックモーフィング、密度登録、残留流の精製を統合している。
拡散モジュールは、大きな外観ギャップをブリッジする中間形態素フレームを合成し、RoMaは連続するフレーム間の段階的対応を推定できる。
合成された流れは、軽量なU-Netを通して洗練され、元のイメージペアを共登録する高忠実なワープを生成する。
LEVIR-CD, WHU-CD, DSIFN-CDの広範囲な実験により, 複数のバックボーンにおける登録精度と下流変化検出において一貫した利得を示し, 提案手法の汎用性と有効性を示した。
関連論文リスト
- DiffRegCD: Integrated Registration and Change Detection with Diffusion Features [74.3102451211493]
DiffRegCDは、単一のモデルで密度の高い登録と変更検出を統一する統合フレームワークである。
空中(LEVIR-CD, DSIFN-CD, WHU-CD, SYSU-CD)と地上(VL-CMU-CD)のデータセットによる実験は、DiffRegCDが最近のベースラインを一貫して上回っていることを示している。
論文 参考訳(メタデータ) (2025-11-11T07:32:19Z) - Efficient Large-Deformation Medical Image Registration via Recurrent Dynamic Correlation [3.0110453390062446]
畳み込みネットワークは局所的な特徴を集約するが、ボクセル対応の直接的なモデリングは欠如している。
大規模変形に対する効率的なマッチングを支援するリカレント相関型マッチングフレームワークを提案する。
脳MRIと腹部CTのデータセットについて,アフィン前登録と非登録の2つの設定で実験を行った。
論文 参考訳(メタデータ) (2025-10-25T17:49:29Z) - Wavelet-Guided Dual-Frequency Encoding for Remote Sensing Change Detection [67.84730634802204]
リモートセンシング画像の変化検出は,自然災害監視,都市拡張追跡,インフラ管理など,さまざまな工学的応用において重要な役割を担っている。
既存のほとんどの手法は空間領域モデリングに依存しており、特徴表現の限られた多様性は微妙な変化領域の検出を妨げる。
本研究では、特にウェーブレット領域における周波数領域の特徴モデリングが周波数成分の微細な違いを増幅し、空間領域において捉えにくいエッジ変化の知覚を高めることを観察する。
論文 参考訳(メタデータ) (2025-08-07T11:14:16Z) - OptiCorNet: Optimizing Sequence-Based Context Correlation for Visual Place Recognition [2.3093110834423616]
本稿では,新しいシーケンスモデリングフレームワークOptiCorNetを提案する。
空間的特徴抽出と時間的差分を微分可能でエンドツーエンドのトレーニング可能なモジュールに統一する。
本手法は,季節的・視点的な変化に挑戦し,最先端のベースラインよりも優れる。
論文 参考訳(メタデータ) (2025-07-19T04:29:43Z) - Multimodal LLM-Guided Semantic Correction in Text-to-Image Diffusion [52.315729095824906]
MLLM Semantic-Corrected Ping-Pong-Ahead Diffusion (PPAD) は,マルチモーダル大言語モデル(MLLM)を推論中の意味的オブザーバとして導入する新しいフレームワークである。
中間世代をリアルタイムに分析し、潜在意味的不整合を識別し、フィードバックを制御可能な信号に変換し、残りの認知ステップを積極的に導く。
大規模な実験ではPPADの大幅な改善が示されている。
論文 参考訳(メタデータ) (2025-05-26T14:42:35Z) - Fast Diffeomorphic Image Registration using Patch based Fully Convolutional Networks [5.479932919974457]
本稿では,高速な微分画像登録のための,教師なし学習に基づく完全畳み込みネットワーク(FCN)フレームワークを提案する。
3つの異なるT1強調MRI(T1w MRI)データセットを用いて実験を行った。
論文 参考訳(メタデータ) (2024-04-05T17:46:38Z) - Improving Misaligned Multi-modality Image Fusion with One-stage
Progressive Dense Registration [67.23451452670282]
多モード画像間の相違は、画像融合の課題を引き起こす。
マルチスケールプログレッシブ・センス・レジストレーション方式を提案する。
このスキームは、一段階最適化のみで粗大な登録を行う。
論文 参考訳(メタデータ) (2023-08-22T03:46:24Z) - Breaking Modality Disparity: Harmonized Representation for Infrared and
Visible Image Registration [66.33746403815283]
シーン適応型赤外線と可視画像の登録を提案する。
我々は、異なる平面間の変形をシミュレートするためにホモグラフィーを用いる。
我々は、まず、赤外線と可視画像のデータセットが不一致であることを示す。
論文 参考訳(メタデータ) (2023-04-12T06:49:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。