論文の概要: Cross-View Localization via Redundant Sliced Observations and A-Contrario Validation
- arxiv url: http://arxiv.org/abs/2508.05369v1
- Date: Thu, 07 Aug 2025 13:15:49 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-08 18:59:39.872344
- Title: Cross-View Localization via Redundant Sliced Observations and A-Contrario Validation
- Title(参考訳): 冗長スライス観測とA-Contrarioバリデーションによるクロスビュー位置決め
- Authors: Yongjun Zhang, Mingtao Xiong, Yi Wan, Gui-Song Xia,
- Abstract要約: クロスビューローカライゼーション(CVL)は、地上レベルの画像と空中参照とをマッチングして、カメラの位置を決定する。
ほとんどのCVL法は、単一の観察のみを出力し、カメラはポーズし、測量原理によって必要とされる冗長な観察を欠いている。
Slice-LocはCVLのアコントラリオ信頼性検証を特徴とする2段階の手法である。
- 参考スコア(独自算出の注目度): 32.65981868612918
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Cross-view localization (CVL) matches ground-level images with aerial references to determine the geo-position of a camera, enabling smart vehicles to self-localize offline in GNSS-denied environments. However, most CVL methods output only a single observation, the camera pose, and lack the redundant observations required by surveying principles, making it challenging to assess localization reliability through the mutual validation of observational data. To tackle this, we introduce Slice-Loc, a two-stage method featuring an a-contrario reliability validation for CVL. Instead of using the query image as a single input, Slice-Loc divides it into sub-images and estimates the 3-DoF pose for each slice, creating redundant and independent observations. Then, a geometric rigidity formula is proposed to filter out the erroneous 3-DoF poses, and the inliers are merged to generate the final camera pose. Furthermore, we propose a model that quantifies the meaningfulness of localization by estimating the number of false alarms (NFA), according to the distribution of the locations of the sliced images. By eliminating gross errors, Slice-Loc boosts localization accuracy and effectively detects failures. After filtering out mislocalizations, Slice-Loc reduces the proportion of errors exceeding 10 m to under 3\%. In cross-city tests on the DReSS dataset, Slice-Loc cuts the mean localization error from 4.47 m to 1.86 m and the mean orientation error from $\mathbf{3.42^{\circ}}$ to $\mathbf{1.24^{\circ}}$, outperforming state-of-the-art methods. Code and dataset will be available at: https://github.com/bnothing/Slice-Loc.
- Abstract(参考訳): クロスビューローカライゼーション(CVL)は地上レベルの画像と空中参照とを一致させてカメラの位置を決定する。
しかし,ほとんどのCVL法は1つの観測のみを出力しており,カメラのポーズであり,観測原理による冗長な観測が欠如しているため,観測データの相互検証による局所化信頼性の評価が困難である。
そこで本研究では,CVLのアコントラリオ信頼性検証を特徴とする2段階の手法であるSlice-Locを紹介する。
クエリイメージを単一の入力として使用する代わりに、Slice-Locはそれをサブイメージに分割し、スライス毎に3DoFのポーズを推定し、冗長で独立した観察を生成する。
次に, 3DoF の誤ったポーズを除去するために幾何剛性公式を提案し, インレーヤをマージして最終カメラポーズを生成する。
さらに,スライスした画像の位置の分布に応じて,偽アラーム数(NFA)を推定することにより,位置の意義を定量化するモデルを提案する。
重大なエラーを排除することによって、Slice-Locはローカライゼーションの精度を高め、障害を効果的に検出する。
ミスローカライズをフィルタリングした後、Slice-Locは10mを超えるエラーの割合を3\%以下に下げる。
DReSSデータセットのクロスシティテストでは、Slice-Locは平均ローカライゼーション誤差を4.47mから1.86mに、平均配向誤差を$\mathbf{3.42^{\circ}}$から$\mathbf{1.24^{\circ}}$に削減し、最先端の手法より優れている。
コードとデータセットは、https://github.com/bnothing/Slice-Loc.comで利用可能になる。
関連論文リスト
- Zero-shot Inexact CAD Model Alignment from a Single Image [53.37898107159792]
1つの画像から3Dシーン構造を推測する実践的なアプローチは、データベースから密に一致する3Dモデルを検索し、画像内のオブジェクトと整列させることである。
既存のメソッドは、イメージによる教師付きトレーニングとアノテーションのポーズに依存しており、オブジェクトカテゴリの狭いセットに制限されている。
ポーズアノテーションを必要とせず、未知のカテゴリに一般化する不正確な3次元モデルの弱い教師付き9-DoFアライメント法を提案する。
論文 参考訳(メタデータ) (2025-07-04T04:46:59Z) - GSplatLoc: Ultra-Precise Camera Localization via 3D Gaussian Splatting [0.0]
超精密ポーズ推定に3次元ガウススプラッティングの可変レンダリング機能を利用するカメラローカライズ手法であるGSplatLocを提案する。
GSplatLocは、高密度マッピングのローカライズのための新しいベンチマークを設定し、ロボット工学や拡張現実のような正確なリアルタイムローカライズを必要とするアプリケーションに重要な意味を持つ。
論文 参考訳(メタデータ) (2024-12-28T07:14:14Z) - SCIPaD: Incorporating Spatial Clues into Unsupervised Pose-Depth Joint Learning [17.99904937160487]
本研究では,教師なし深層学習のための空間的手がかりを取り入れた新しいアプローチであるSCIPaDを紹介する。
SCIPaDは平均翻訳誤差22.2%、カメラポーズ推定タスクの平均角誤差34.8%をKITTI Odometryデータセットで達成している。
論文 参考訳(メタデータ) (2024-07-07T06:52:51Z) - GLACE: Global Local Accelerated Coordinate Encoding [66.87005863868181]
シーン座標回帰法は小規模なシーンでは有効であるが、大規模シーンでは重大な課題に直面している。
本研究では,事前学習したグローバルおよびローカルのエンコーディングを統合したGLACEを提案する。
提案手法は,低マップサイズモデルを用いて,大規模シーンにおける最先端結果を実現する。
論文 参考訳(メタデータ) (2024-06-06T17:59:50Z) - DVMNet++: Rethinking Relative Pose Estimation for Unseen Objects [59.51874686414509]
既存のアプローチでは、通常、接地構造オブジェクト境界ボックスと、多数の離散仮説を持つ近似3次元回転を用いて3次元翻訳を予測している。
本稿では,1回のパスで相対オブジェクトのポーズを計算するDeep Voxel Matching Network (DVMNet++)を提案する。
提案手法は,最先端手法と比較して計算コストの低い新しいオブジェクトに対して,より正確な相対的ポーズ推定を行う。
論文 参考訳(メタデータ) (2024-03-20T15:41:32Z) - Occ$^2$Net: Robust Image Matching Based on 3D Occupancy Estimation for
Occluded Regions [14.217367037250296]
Occ$2$Netは、3D占有率を用いて閉塞関係をモデル化し、閉塞領域の一致点を推測する画像マッチング手法である。
本手法は実世界とシミュレーションデータセットの両方で評価し,いくつかの指標における最先端手法よりも優れた性能を示す。
論文 参考訳(メタデータ) (2023-08-14T13:09:41Z) - Convolutional Cross-View Pose Estimation [9.599356978682108]
クロスビューポーズ推定のための新しいエンドツーエンド手法を提案する。
提案手法は,VIGORおよびKITTIデータセット上で検証される。
オックスフォード・ロボットカーのデータセットでは,エゴ車両の姿勢を時間とともに確実に推定することができる。
論文 参考訳(メタデータ) (2023-03-09T13:52:28Z) - A Unified BEV Model for Joint Learning of 3D Local Features and Overlap
Estimation [12.499361832561634]
本稿では,3次元局所特徴の同時学習と重なり推定のための統合鳥眼ビュー(BEV)モデルを提案する。
提案手法は,特に重複の少ないシーンにおいて,重複予測における既存手法よりも優れていた。
論文 参考訳(メタデータ) (2023-02-28T12:01:16Z) - Boosting Few-shot Fine-grained Recognition with Background Suppression
and Foreground Alignment [53.401889855278704]
FS-FGR (Few-shot Fine-fine Recognition) は、限られたサンプルの助けを借りて、新しいきめ細かなカテゴリを認識することを目的としている。
本研究では,背景アクティベーション抑制 (BAS) モジュール,フォアグラウンドオブジェクトアライメント (FOA) モジュール,および局所的局所的(L2L) 類似度測定器からなる2段階の背景アライメントとフォアグラウンドアライメントフレームワークを提案する。
複数のベンチマークで行った実験により,提案手法は既存の最先端技術よりも大きなマージンで優れていることが示された。
論文 参考訳(メタデータ) (2022-10-04T07:54:40Z) - Uncertainty-Aware Camera Pose Estimation from Points and Lines [101.03675842534415]
Perspective-n-Point-and-Line (Pn$PL) は、2D-3D特徴座標の3Dモデルに関して、高速で正確で堅牢なカメラローカライゼーションを目指している。
論文 参考訳(メタデータ) (2021-07-08T15:19:36Z) - Video-based Person Re-identification without Bells and Whistles [49.51670583977911]
ビデオベースの人物再識別(Re-ID)は、異なるカメラの下で歩行者を特定するために、ビデオトラッカーとトリミングされたビデオフレームをマッチングすることを目的としている。
従来の方法による不完全な検出と追跡の結果から, 収穫したトラックレットの空間的, 時間的不整合が生じている。
本稿では,深層学習に基づくトラックレットの検出と追跡を適用することで,これらの予期せぬノイズを効果的に低減できる簡易な再検出リンク(DL)モジュールを提案する。
論文 参考訳(メタデータ) (2021-05-22T10:17:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。