論文の概要: MRGeo: Robust Cross-View Geo-Localization of Corrupted Images via Spatial and Channel Feature Enhancement
- arxiv url: http://arxiv.org/abs/2603.12587v1
- Date: Fri, 13 Mar 2026 02:37:43 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-16 17:38:11.856784
- Title: MRGeo: Robust Cross-View Geo-Localization of Corrupted Images via Spatial and Channel Feature Enhancement
- Title(参考訳): MRGeo: 空間的・チャネル的特徴増強による崩壊画像のロバストなクロスビュージオローカライゼーション
- Authors: Le Wu, Lv Bo, Songsong Ouyang, Yingying Zhu,
- Abstract要約: クロスビュージオローカライゼーション (CVGL) は、対応するジオタグ付き衛星画像の検索により、ストリートビュー画像を正確にローカライズすることを目的としている。
以前の研究は、特定の標準データセット上でほぼ完璧なパフォーマンスを達成したが、現実の腐敗した環境での堅牢性は、まだ未調査のままである。
汚職下での堅牢なCVGLのための最初の体系的手法であるMRGeoを紹介する。
- 参考スコア(独自算出の注目度): 15.9788448312641
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Cross-view geo-localization (CVGL) aims to accurately localize street-view images through retrieval of corresponding geo-tagged satellite images. While prior works have achieved nearly perfect performance on certain standard datasets, their robustness in real-world corrupted environments remains under-explored. This oversight causes severe performance degradation or failure when images are affected by corruption such as blur or weather, significantly limiting practical deployment. To address this critical gap, we introduce MRGeo, the first systematic method designed for robust CVGL under corruption. MRGeo employs a hierarchical defense strategy that enhances the intrinsic quality of features and then enforces a robust geometric prior. Its core is the Spatial-Channel Enhancement Block, which contains: (1) a Spatial Adaptive Representation Module that models global and local features in parallel and uses a dynamic gating mechanism to arbitrate their fusion based on feature reliability; and (2) a Channel Calibration Module that performs compensatory adjustments by modeling multi-granularity channel dependencies to counteract information loss. To prevent spatial misalignment under severe corruption, a Region-level Geometric Alignment Module imposes a geometric structure on the final descriptors, ensuring coarse-grained consistency. Comprehensive experiments on both robustness benchmark and standard datasets demonstrate that MRGeo not only achieves an average R@1 improvement of 2.92\% across three comprehensive robustness benchmarks (CVUSA-C-ALL, CVACT\_val-C-ALL, and CVACT\_test-C-ALL) but also establishes superior performance in cross-area evaluation, thereby demonstrating its robustness and generalization capability.
- Abstract(参考訳): クロスビュージオローカライゼーション (CVGL) は、対応するジオタグ付き衛星画像の検索により、ストリートビュー画像を正確にローカライズすることを目的としている。
以前の研究は、特定の標準データセット上でほぼ完璧なパフォーマンスを達成したが、現実の腐敗した環境での堅牢性は、まだ未調査のままである。
この監視は、画像がぼやけや天候などの腐敗によって影響を受ける場合、重大なパフォーマンス劣化や失敗を引き起こし、実際の配置を著しく制限する。
この致命的なギャップに対処するために,汚職下での堅牢なCVGLを設計した最初の体系的手法であるMRGeoを導入する。
MRGeoは階層的な防御戦略を採用しており、特徴の内在的な品質を高め、より堅牢な幾何学的事前を強制する。
1)グローバルな特徴とローカルな特徴を並列にモデル化し,動的ゲーティング機構を用いて特徴信頼性に基づいて融合を調停する空間適応表現モジュール,2)情報損失に対応するために複数の粒度チャネル依存性をモデル化して補償調整を行うチャネルキャリブレーションモジュールである。
深刻な汚職下での空間的不整合を防止するため、領域レベルの幾何学的アライメントモジュールは最終記述子に幾何学的構造を課し、粗い粒度の整合性を確保する。
3つの総合ロバストネスベンチマーク(CVUSA-C-ALL, CVACT\_val-C-ALL, CVACT\_test-C-ALL)でMRGeoが平均R@1の改善率2.92\%を達成するだけでなく、クロスエリア評価における優れた性能を確立し、そのロバストネスと一般化能力を示すことを実証した。
関連論文リスト
- CVGL: Causal Learning and Geometric Topology [2.110335380179406]
クロスビュージオローカライゼーション(CVGL)は,道路画像の地理的位置を対応する航空画像とマッチングすることにより推定することを目的としている。
これは、複雑な現実世界のシナリオにおける自律的なナビゲーションとマッピングにとって重要である。
これらの問題に対処するための因果学習・幾何学的トポロジーフレームワークを提案する。
論文 参考訳(メタデータ) (2026-03-13T01:25:53Z) - GeoFocus: Blending Efficient Global-to-Local Perception for Multimodal Geometry Problem-Solving [55.14836667214487]
GeoFocusは、2つのコアモジュールからなる新しいフレームワークである。
GeoFocusは、主要な特殊モデルよりも4.7%の精度向上を実現している。
多様な視覚条件下でのMATHVERSEの強靭性を示す。
論文 参考訳(メタデータ) (2026-02-09T11:15:01Z) - Dynamic Topology Awareness: Breaking the Granularity Rigidity in Vision-Language Navigation [22.876516699004814]
VLN-CE(Vision-Language Navigation in Continuous Environments)は、高レベルの言語命令を正確で安全で長期の空間行動に基礎付けるという、中核的な課題を提示している。
露骨なトポロジカルマップは、そのようなタスクにおいて堅牢な空間記憶を提供するための重要な解決策であることが証明されている。
既存のトポロジカルプランニング手法は、"Granularity Rigidity"問題に悩まされている。
本研究では,動的トポロジカルナビゲーションのためのフレームワークであるDGNavを提案する。
論文 参考訳(メタデータ) (2026-01-29T14:06:23Z) - MS-ISSM: Objective Quality Assessment of Point Clouds Using Multi-scale Implicit Structural Similarity [65.85858856481131]
点雲の非構造的で不規則な性質は、客観的品質評価(PCQA)に重大な課題をもたらす
マルチスケールインシシシット構造類似度測定(MS-ISSM)を提案する。
論文 参考訳(メタデータ) (2026-01-03T14:58:52Z) - UAGLNet: Uncertainty-Aggregated Global-Local Fusion Network with Cooperative CNN-Transformer for Building Extraction [83.48950950780554]
リモートセンシング画像からの抽出は、複雑な構造変化のために難しい課題である。
既存の方法は、セグメンテーションモデルにおけるマルチスケール特徴をキャプチャするために、畳み込みブロックまたは自己アテンションブロックを使用する。
高品質なグローバルローカルなビジュアルセマンティクスを活用するために,不確実性集約型グローバルローカルフュージョンネットワーク(UAGLNet)を提案する。
論文 参考訳(メタデータ) (2025-12-15T02:59:16Z) - Enhancing Cross-View Geo-Localization Generalization via Global-Local Consistency and Geometric Equivariance [20.376805098370067]
クロスビューなジオローカライゼーションは、大きく異なる視点から捉えた同じ位置の画像をマッチングすることを目的としている。
クロスドメインの一般化を促進するための新しいCVGLフレームワークであるEGSを提案する。
EGSは一貫して大幅なパフォーマンス向上を実現し、クロスドメインCVGLにおける新しい最先端技術を確立している。
論文 参考訳(メタデータ) (2025-09-25T02:35:21Z) - Cross-View Geo-Localization with Street-View and VHR Satellite Imagery in Decentrality Settings [39.252555758596706]
Cross-View Geo-Localizationは、ストリートビュークエリ画像とジオタグ付き空中ビュー参照画像とを一致させる。
分散性はより深い調査を保証する重要な要因であり、より大規模な分散性は局所化効率を大幅に改善できるが、局所化精度の低下のコストがかかる。
DReSSは、広い地理的範囲と多様な景観を持つクロスビューなジオローカライゼーションを評価するために設計された、新しいデータセットである。
論文 参考訳(メタデータ) (2024-12-16T08:07:53Z) - Decoupling Fine Detail and Global Geometry for Compressed Depth Map Super-Resolution [55.9977636042469]
圧縮深度マップ超解像のための新しいフレームワークGDNetを提案する。
グローバルおよび詳細な幾何学的特徴を別々に扱うことにより、高品質な深度マップ再構築プロセスを分離する。
我々の解は、幾何的整合性と詳細回復の観点から、現在の方法よりも大幅に優れています。
論文 参考訳(メタデータ) (2024-11-05T16:37:30Z) - Cross-Scan Mamba with Masked Training for Robust Spectral Imaging [51.557804095896174]
本研究では,空間スペクトルSSMを用いたクロススキャンマンバ(CS-Mamba)を提案する。
実験の結果, CS-Mambaは最先端の性能を達成し, マスク付きトレーニング手法によりスムーズな特徴を再構築し, 視覚的品質を向上させることができた。
論文 参考訳(メタデータ) (2024-08-01T15:14:10Z) - Dual-scale Enhanced and Cross-generative Consistency Learning for Semi-supervised Medical Image Segmentation [49.57907601086494]
医用画像のセグメンテーションはコンピュータ支援診断において重要な役割を担っている。
半教師型医用画像(DEC-Seg)のための新しいDual-scale Enhanced and Cross-generative consistency learning frameworkを提案する。
論文 参考訳(メタデータ) (2023-12-26T12:56:31Z) - GeoDTR+: Toward generic cross-view geolocalization via geometric disentanglement [20.346145927174373]
Cross-View Geo-Localization (CVGL) は、データベース内のジオタグ付き空中画像とマッチングすることで、地上画像の位置を推定する。
既存の手法は、トレーニングデータとテストデータが完全に異なる領域から取得されるクロスエリア評価において、依然としてパフォーマンスの低下に悩まされている。
視覚的特徴の幾何学的レイアウトを抽出する能力の欠如と,低レベルの細部への過度な適合が原因と考えられる。
本研究では,視覚的特徴間の相関をモデル化する拡張GLEモジュールを用いたGeoDTR+を提案する。
論文 参考訳(メタデータ) (2023-08-18T15:32:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。