論文の概要: GDROS: A Geometry-Guided Dense Registration Framework for Optical-SAR Images under Large Geometric Transformations
- arxiv url: http://arxiv.org/abs/2511.00598v1
- Date: Sat, 01 Nov 2025 15:40:34 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-05 16:37:26.85662
- Title: GDROS: A Geometry-Guided Dense Registration Framework for Optical-SAR Images under Large Geometric Transformations
- Title(参考訳): GDROS:幾何変換による光学SAR画像のための幾何学誘導高密度レジストレーションフレームワーク
- Authors: Zixuan Sun, Shuaifeng Zhi, Ruize Li, Jingyuan Xia, Yongxiang Liu, Weidong Jiang,
- Abstract要約: 我々はGDROSを提案する。GDROSはグローバルなクロスモーダル画像の相互作用を利用したジオメトリ誘導型密度登録フレームワークである。
まず、CNN-Transformerハイブリッド特徴抽出モジュールを用いて、光学画像とSAR画像からクロスモーダルな深度特徴を抽出する。
次に、予測された高密度光流場を幾何学的に制約する最小二乗回帰(LSR)モジュールを実装した。
- 参考スコア(独自算出の注目度): 24.22541638346487
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Registration of optical and synthetic aperture radar (SAR) remote sensing images serves as a critical foundation for image fusion and visual navigation tasks. This task is particularly challenging because of their modal discrepancy, primarily manifested as severe nonlinear radiometric differences (NRD), geometric distortions, and noise variations. Under large geometric transformations, existing classical template-based and sparse keypoint-based strategies struggle to achieve reliable registration results for optical-SAR image pairs. To address these limitations, we propose GDROS, a geometry-guided dense registration framework leveraging global cross-modal image interactions. First, we extract cross-modal deep features from optical and SAR images through a CNN-Transformer hybrid feature extraction module, upon which a multi-scale 4D correlation volume is constructed and iteratively refined to establish pixel-wise dense correspondences. Subsequently, we implement a least squares regression (LSR) module to geometrically constrain the predicted dense optical flow field. Such geometry guidance mitigates prediction divergence by directly imposing an estimated affine transformation on the final flow predictions. Extensive experiments have been conducted on three representative datasets WHU-Opt-SAR dataset, OS dataset, and UBCv2 dataset with different spatial resolutions, demonstrating robust performance of our proposed method across different imaging resolutions. Qualitative and quantitative results show that GDROS significantly outperforms current state-of-the-art methods in all metrics. Our source code will be released at: https://github.com/Zi-Xuan-Sun/GDROS.
- Abstract(参考訳): 光学・合成開口レーダ(SAR)リモートセンシング画像の登録は、画像融合および視覚ナビゲーションタスクの重要な基盤となる。
この課題は、主に高度非線形ラジオメトリック差(NRD)、幾何歪み、ノイズ変動として表されるモードの相違により特に困難である。
大きな幾何学変換の下では、既存の古典的テンプレートベースおよびスパースキーポイントベースの戦略は、光学SAR画像対の信頼性の高い登録結果を達成するのに苦労する。
これらの制約に対処するため,グローバルなクロスモーダル画像相互作用を利用したジオメトリ誘導密度登録フレームワークGDROSを提案する。
まず,CNN-Transformerハイブリッド特徴抽出モジュールを用いて,光学・SAR画像からクロスモーダルな深い特徴を抽出する。
その後、予測された高密度光流場を幾何学的に制約する最小二乗回帰 (LSR) モジュールを実装した。
このような幾何学的ガイダンスは、最終的なフロー予測に推定されたアフィン変換を直接適用することにより、予測の分岐を緩和する。
空間分解能の異なるWHU-Opt-SARデータセット,OSデータセット,UBCv2データセットの3つの代表的なデータセットに対して大規模な実験を行った。
定性的かつ定量的な結果から、GDROSは全ての指標において現在の最先端の手法よりも著しく優れていることが分かる。
ソースコードは、https://github.com/Zi-Xuan-Sun/GDROS.comで公開されます。
関連論文リスト
- Grid-Reg: Detector-Free Gridized Feature Learning and Matching for Large-Scale SAR-Optical Image Registration [22.80821597640134]
大規模で異質なSARと光学画像、特にプラットフォーム間での登録は非常に困難である。
これらの課題を克服するため,グリッドベースのマルチモーダル登録フレームワークであるGrid-Regを提案する。
提案手法は最先端手法よりも優れた性能を実現する。
論文 参考訳(メタデータ) (2025-07-06T03:43:18Z) - Multi-Resolution SAR and Optical Remote Sensing Image Registration Methods: A Review, Datasets, and Future Perspectives [13.749888089968373]
リモートセンシングデータ融合には合成開口レーダ(SAR)と光画像登録が不可欠である。
画像の解像度が向上するにつれて、微細なSARテクスチャがより重要になり、アライメントの問題と3次元空間の相違が生じる。
MultiResSARデータセットは10万組以上のマルチソース、マルチ解像度、マルチシーンSARおよび光学画像を含む。
論文 参考訳(メタデータ) (2025-02-03T02:51:30Z) - Deep Learning Based Speckle Filtering for Polarimetric SAR Images. Application to Sentinel-1 [51.404644401997736]
本稿では、畳み込みニューラルネットワークを用いて偏光SAR画像のスペックルを除去するための完全なフレームワークを提案する。
実験により,提案手法はスペックル低減と分解能保存の両方において例外的な結果をもたらすことが示された。
論文 参考訳(メタデータ) (2024-08-28T10:07:17Z) - Semantic Guided Large Scale Factor Remote Sensing Image Super-resolution with Generative Diffusion Prior [13.148815217684277]
大規模因子超解像(SR)アルゴリズムは、軌道から取得した低解像度(LR)衛星データの最大化に不可欠である。
既存の手法では、鮮明なテクスチャと正しい接地オブジェクトでSR画像を復元する際の課題に直面している。
本稿では,大規模リモートセンシング画像の超解像を実現するための新しいフレームワークであるセマンティックガイド拡散モデル(SGDM)を提案する。
論文 参考訳(メタデータ) (2024-05-11T16:06:16Z) - Rotated Multi-Scale Interaction Network for Referring Remote Sensing Image Segmentation [63.15257949821558]
Referring Remote Sensing Image (RRSIS)は、コンピュータビジョンと自然言語処理を組み合わせた新しい課題である。
従来の参照画像(RIS)アプローチは、空中画像に見られる複雑な空間スケールと向きによって妨げられている。
本稿ではRMSIN(Rotated Multi-Scale Interaction Network)を紹介する。
論文 参考訳(メタデータ) (2023-12-19T08:14:14Z) - A Multiscale Graph Convolutional Network for Change Detection in
Homogeneous and Heterogeneous Remote Sensing Images [12.823633963080281]
リモートセンシング画像における変化検出(CD)は、常に研究の領域を広げています。
本稿では,グラフ畳み込みネットワーク(gcn)に基づく新しいcd法と,均質画像と異種画像の両方に対して多スケールオブジェクトベース手法を提案する。
論文 参考訳(メタデータ) (2021-02-16T09:26:31Z) - A Parallel Down-Up Fusion Network for Salient Object Detection in
Optical Remote Sensing Images [82.87122287748791]
光リモートセンシング画像(RSI)における有意な物体検出のための新しい並列ダウンアップフュージョンネットワーク(PDF-Net)を提案する。
In-pathの低レベル・高レベルな特徴とクロスパスの多解像度な特徴をフル活用して、多様なスケールのサルエントオブジェクトを識別し、散らかった背景を抑える。
ORSSDデータセットの実験により、提案したネットワークは定性的かつ定量的に最先端のアプローチよりも優れていることが示された。
論文 参考訳(メタデータ) (2020-10-02T05:27:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。