論文の概要: From Horizontal to Rotated: Cross-View Object Geo-Localization with Orientation Awareness
- arxiv url: http://arxiv.org/abs/2603.14856v1
- Date: Mon, 16 Mar 2026 05:56:06 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-17 16:19:36.080651
- Title: From Horizontal to Rotated: Cross-View Object Geo-Localization with Orientation Awareness
- Title(参考訳): 水平から回転へ:方向認識を伴うクロスビューオブジェクトジオローカライゼーション
- Authors: Chenlin Fu, Ao Gong, Yingying Zhu,
- Abstract要約: クロスビューオブジェクトジオローカライゼーション(CVOGL)は、地上またはドローンの観点から、クエリオブジェクトの地理的座標を正確に決定することを目的としている。
我々は,マルチスケール認識モジュールと指向性ヘッドを備えた新しいジオローカライズフレームワークOSGeoを紹介する。
このスキームをサポートするために、我々はCVOGL用の正確なRBoxアノテーションを持つ最初のデータセットであるCVOGL-Rを構築し、リリースする。
- 参考スコア(独自算出の注目度): 3.5982006325887554
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Cross-View object geo-localization (CVOGL) aims to precisely determine the geographic coordinates of a query object from a ground or drone perspective by referencing a satellite map. Segmentation-based approaches offer high precision but require prohibitively expensive pixel-level annotations, whereas more economical detection-based methods suffer from lower accuracy. This performance disparity in detection is primarily caused by two factors: the poor geometric fit of Horizontal Bounding Boxes (HBoxes) for oriented objects and the degradation in precision due to feature map scaling. Motivated by these, we propose leveraging Rotated Bounding Boxes (RBoxes) as a natural extension of the detection-based paradigm. RBoxes provide a much tighter geometric fit to oriented objects. Building on this, we introduce OSGeo, a novel geo-localization framework, meticulously designed with a multi-scale perception module and an orientation-sensitive head to accurately regress RBoxes. To support this scheme, we also construct and release CVOGL-R, the first dataset with precise RBox annotations for CVOGL. Extensive experiments demonstrate that our OSGeo achieves state-of-the-art performance, consistently matching or even surpassing the accuracy of leading segmentation-based methods but with an annotation cost that is over an order of magnitude lower.
- Abstract(参考訳): クロスビューオブジェクトジオローカライゼーション(CVOGL)は、衛星地図を参照することにより、地上またはドローンの観点からクエリオブジェクトの地理的座標を正確に決定することを目的としている。
セグメンテーションベースのアプローチは高い精度を提供するが、高額なピクセルレベルのアノテーションを必要とする。
この検出性能の相違は主に、オブジェクト指向物体に対する水平バウンディングボックス(HBox)の幾何学的適合性の低さと、特徴写像のスケーリングによる精度低下の2つの要因から生じる。
そこで本研究では、RBox(Rotated Bounding Boxes)を検出ベースパラダイムの自然な拡張として活用することを提案する。
RBoxesは、オブジェクト指向オブジェクトにより厳密な幾何学的適合を提供する。
そこで我々は,マルチスケールの認識モジュールと,RBoxを正確に回帰させる指向性ヘッドを備えた,新しいジオローカライゼーションフレームワークOSGeoを紹介した。
このスキームをサポートするために、我々はCVOGL用の正確なRBoxアノテーションを持つ最初のデータセットであるCVOGL-Rを構築し、リリースする。
大規模な実験により、我々のOSGeoは最先端のセグメンテーションベースの手法の精度を一貫した整合性や超越性を達成できるが、アノテーションのコストは桁違いに低いことがわかった。
関連論文リスト
- IoUCert: Robustness Verification for Anchor-based Object Detectors [58.35703549470485]
IoUCertは、アンカーベースのオブジェクト検出アーキテクチャにおいて、これらのボトルネックを克服するために設計された、新しい形式的検証フレームワークである。
本手法は, SSD, YOLOv2, YOLOv3など, 現実的なアンカーベースモデルの各種入力摂動に対するロバスト性検証を可能にする。
論文 参考訳(メタデータ) (2026-03-03T14:36:46Z) - SegEarth-R2: Towards Comprehensive Language-guided Segmentation for Remote Sensing Images [49.52402091341301]
現在のモデルは単純な単一ターゲットのコマンドを解析できるが、複雑な地理空間シナリオで表されると失敗する。
総合的なトレーニングと評価のために構築された最初の大規模データセットであるLaSeRSを紹介する。
また,SegEarth-R2 は RS における包括的言語誘導セグメンテーションのために設計されたMLLM アーキテクチャである。
論文 参考訳(メタデータ) (2025-12-23T03:10:17Z) - SMGeo: Cross-View Object Geo-Localization with Grid-Level Mixture-of-Experts [4.521626189942935]
クロスビューオブジェクト ジオローカライゼーションは、ドローン画像に基づいて、大規模な衛星画像間で同じ物体を正確に特定することを目的としている。
SMGeoは、オブジェクトジオローカライゼーションのための、高速でエンドツーエンドなトランスフォーマベースモデルである。
論文 参考訳(メタデータ) (2025-11-18T03:21:20Z) - Seeing the Unseen: Mask-Driven Positional Encoding and Strip-Convolution Context Modeling for Cross-View Object Geo-Localization [8.559240391514063]
クロスビューオブジェクトジオローカライゼーションは、クロスビューマッチングによる高精度オブジェクトローカライゼーションを可能にする。
既存の手法はキーポイントに基づく位置符号化に依存しており、オブジェクトの形状情報を無視しながら2次元座標のみをキャプチャする。
空間座標と物体シルエットの両方を捕捉するために分割マスクを利用するマスクベースの位置符号化方式を提案する。
EDGeoは、堅牢なクロスビューオブジェクトジオローカライズのためのエンドツーエンドフレームワークである。
論文 参考訳(メタデータ) (2025-10-23T06:07:07Z) - Anchor-free Cross-view Object Geo-localization with Gaussian Position Encoding and Cross-view Association [3.5982006325887554]
AFGeo と呼ばれるクロスビューオブジェクトのジオローカライゼーションのためのアンカーフリーな定式化を提案する。
AFGeoは、事前に定義されたアンカーを使わずにオブジェクトをローカライズする各ピクセルに対して、4つの方向のオフセットをグラウンドトルースボックスに直接予測する。
我々のモデルは軽量かつ効率的であり、ベンチマークデータセット上で最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2025-09-30T00:30:45Z) - RGB-based Category-level Object Pose Estimation via Decoupled Metric
Scale Recovery [72.13154206106259]
本研究では、6次元のポーズとサイズ推定を分離し、不完全なスケールが剛性変換に与える影響を緩和するパイプラインを提案する。
具体的には,事前学習した単分子推定器を用いて局所的な幾何学的情報を抽出する。
別個のブランチは、カテゴリレベルの統計に基づいてオブジェクトのメートル法スケールを直接復元するように設計されている。
論文 参考訳(メタデータ) (2023-09-19T02:20:26Z) - Cross-view Geo-localization via Learning Disentangled Geometric Layout
Correspondence [11.823147814005411]
クロスビュージオローカライゼーションは、参照ジオタグ付き空中画像データベースとマッチングすることで、クエリーグラウンド画像の位置を推定することを目的としている。
最近の研究は、クロスビューなジオローカライゼーションベンチマークにおいて顕著な進歩を遂げている。
しかし、既存の手法は依然としてクロスエリアベンチマークのパフォーマンスの低下に悩まされている。
論文 参考訳(メタデータ) (2022-12-08T04:54:01Z) - Accurate 3-DoF Camera Geo-Localization via Ground-to-Satellite Image
Matching [102.39635336450262]
地上で取得したクエリ画像とジオタグ付き衛星画像の大規模データベースとをマッチングすることにより、地上から衛星画像のジオローカライズの問題に対処する。
我々の新しい手法は、衛星画像のピクセルサイズの精度まで、クエリー画像のきめ細かい位置を達成できる。
論文 参考訳(メタデータ) (2022-03-26T20:10:38Z) - Anchor-free Oriented Proposal Generator for Object Detection [59.54125119453818]
オブジェクト指向物体検出はリモートセンシング画像解釈において実用的で困難な課題である。
今日では、指向性検出器は主に水平方向の箱を中間体として使用し、それらから指向性のある箱を導出している。
本稿では,ネットワークアーキテクチャから水平ボックス関連操作を放棄する,AOPG(Anchor-free Oriented Proposal Generator)を提案する。
論文 参考訳(メタデータ) (2021-10-05T10:45:51Z) - Scope Head for Accurate Localization in Object Detection [135.9979405835606]
本研究では,各位置のアンカーを相互依存関係としてモデル化したScopeNetと呼ばれる新しい検出器を提案する。
我々の簡潔で効果的な設計により、提案したScopeNetはCOCOの最先端の成果を達成する。
論文 参考訳(メタデータ) (2020-05-11T04:00:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。