論文の概要: MultiLoc: Multi-view Guided Relative Pose Regression for Fast and Robust Visual Re-Localization
- arxiv url: http://arxiv.org/abs/2603.27170v1
- Date: Sat, 28 Mar 2026 07:08:38 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-31 23:18:44.826365
- Title: MultiLoc: Multi-view Guided Relative Pose Regression for Fast and Robust Visual Re-Localization
- Title(参考訳): MultiLoc: 高速かつロバストなビジュアル再ローカライゼーションのためのマルチビューガイド付き相対型回帰
- Authors: Nobel Dang, Bing Li,
- Abstract要約: RPR(Relative Pose Regression)は、目に見えない環境に一般化する。
相対的なポーズ回帰は、ペアワイズと局所的な空間ビューのためにしばしば制限される。
大規模に訓練された新しいマルチビューガイド付きRPRモデルであるMultiLocを提案する。
- 参考スコア(独自算出の注目度): 5.213758062510141
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Relative Pose Regression (RPR) generalizes well to unseen environments, but its performance is often limited due to pairwise and local spatial views. To this end, we propose MultiLoc, a novel multi-view guided RPR model trained at scale, equipping relative pose regression with globally consistent spatial and geometric understanding. Specifically, our method jointly fuses multiple reference views and their associated camera poses in a single forward pass, enabling accurate zero-shot pose estimation with real-time efficiency. To reliably supply informative context, we further propose a co-visibility-driven retrieval strategy for geometrically relevant reference view selection. MultiLoc establishes a new benchmark in visual re-localization, consistently outperforming existing state-of-the-art (SOTA) relative pose regression (RPR) methods across diverse datasets, including WaySpots, Cambridge Landmarks, and Indoor6. Furthermore, MultiLoc's pose regressor exhibits SOTA performance in relative pose estimation, surpassing RPR, feature matching and non-regression-based techniques on the MegaDepth-1500, ScanNet-1500, and ACID benchmarks. These results demonstrate robust domain generalization of MultiLoc across indoor, outdoor and natural environments. Code will be made publicly available.
- Abstract(参考訳): 相対詩回帰(Relative Pose Regression, RPR)は、よく見えない環境に一般化するが、その性能はペアとローカルの空間ビューによって制限されることが多い。
この目的のために,MultiLocを提案する。これはスケールで訓練された新しいマルチビューガイド付きRPRモデルであり,空間的および幾何学的理解が一貫した相対的なポーズ回帰を具備する。
具体的には、複数の参照ビューと関連するカメラのポーズを1つの前方通過で融合させ、リアルタイムに正確なゼロショットポーズ推定を可能にする。
さらに,情報的コンテキストを確実に提供するために,幾何学的に関連する参照ビュー選択のためのコビジュアビリティ駆動型検索戦略を提案する。
MultiLocは、視覚的再ローカライゼーションの新しいベンチマークを確立し、WaySpots、Cambridge Landmarks、Indoor6など、さまざまなデータセットにわたる既存の最先端(SOTA)相対ポーズ回帰(RPR)メソッドを一貫して上回る。
さらに、MultiLocのポーズ回帰器は、相対的なポーズ推定、RPR、特徴マッチング、MegaDepth-1500、ScanNet-1500、ACIDベンチマークにおける非回帰ベースの技術、および相対的なポーズ推定におけるSOTA性能を示す。
これらの結果は、屋内、屋外、自然環境にまたがるMultiLocの堅牢な領域一般化を示す。
コードは公開されます。
関連論文リスト
- Reloc-VGGT: Visual Re-localization with Geometry Grounded Transformer [40.778996326009185]
初期核融合機構による多視点空間統合を行う最初のビジュアルローカライゼーションフレームワークを提案する。
我々のフレームワークはVGGTのバックボーン上に構築されており、多視点3D形状を符号化している。
本研究では,グローバルアテンションの2次複雑さを回避し,計算コストを削減する新しいスパースマスクアテンション戦略を提案する。
論文 参考訳(メタデータ) (2025-12-26T06:12:17Z) - Joint Multi-Condition Representation Modelling via Matrix Factorisation for Visual Place Recognition [14.020214078011515]
マルチ参照視覚的位置認識(VPR)に対処し、様々な条件下でキャプチャされた参照セットを用いて、ローカライゼーション性能を向上させる。
本稿では,複数の参照記述子を行列分解から基底表現へ変換する,学習不要で非依存な手法を提案する。
マルチ・レファレンス・データでは,Recall@1が単一参照よりも最大18%向上し,外観や視点の変化に対してマルチ・レファレンス・ベースラインを上回っている。
論文 参考訳(メタデータ) (2025-10-20T16:50:03Z) - Any Image Restoration via Efficient Spatial-Frequency Degradation Adaptation [158.37640586809187]
劣化した画像を1つのモデルで効率的に復元することは、ますます重要になっている。
我々のアプローチはAnyIRと呼ばれ、様々な劣化にまたがる固有の類似性を活用する統一された経路をとっています。
劣化認識と文脈的注意を融合させるため,空間周波数並列融合戦略を提案する。
論文 参考訳(メタデータ) (2025-04-19T09:54:46Z) - Robust Local Polynomial Regression with Similarity Kernels [0.0]
局所多項式回帰(Local Polynomial Regression, LPR)は、複雑な関係をモデル化するための非パラメトリックな手法である。
従来のLPRは外れ値や高平均点に敏感であり、推定精度に大きな影響を及ぼす可能性がある。
本稿では、回帰重みの計算に使用されるカーネル関数を再検討し、重み付け機構に予測変数と応答変数の両方を組み込んだ新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2025-01-18T11:21:26Z) - Consensus-Adaptive RANSAC [104.87576373187426]
本稿では,パラメータ空間の探索を学習する新しいRANSACフレームワークを提案する。
注意機構は、ポイント・ツー・モデル残差のバッチで動作し、軽量のワンステップ・トランスフォーマーで見いだされたコンセンサスを考慮するために、ポイント・ツー・モデル推定状態を更新する。
論文 参考訳(メタデータ) (2023-07-26T08:25:46Z) - Learning to Localize in Unseen Scenes with Relative Pose Regressors [5.672132510411465]
相対的なポーズ回帰器(RPR)は、相対的な翻訳と回転をポーズラベル付き参照に推定することで、カメラをローカライズする。
しかし実際には、RPRのパフォーマンスは目に見えない場面で著しく劣化している。
我々は、結合、投影、注意操作(Transformer)によるアグリゲーションを実装し、結果として生じる潜在コードから相対的なポーズパラメータを回帰することを学ぶ。
現状のRCPと比較すると、室内および屋外のベンチマークにおいて、表示シーンにおける競合性能を維持しながら、見えない環境において、より優れたローカライズが期待できる。
論文 参考訳(メタデータ) (2023-03-05T17:12:50Z) - RelPose: Predicting Probabilistic Relative Rotation for Single Objects
in the Wild [73.1276968007689]
本稿では、任意のオブジェクトの複数の画像からカメラ視点を推定するデータ駆動手法について述べる。
本手法は, 画像の鮮明さから, 最先端のSfM法とSLAM法より優れていることを示す。
論文 参考訳(メタデータ) (2022-08-11T17:59:59Z) - Benchmarking Visual-Inertial Deep Multimodal Fusion for Relative Pose
Regression and Odometry-aided Absolute Pose Regression [6.557612703872671]
視覚慣性ローカライゼーションは、仮想現実、自動運転車、航空機などのコンピュータビジョンやロボティクスアプリケーションにおいて重要な問題である。
本研究では,ポーズグラフの最適化とアテンションネットワークに基づく深層マルチモーダル融合の評価を行う。
本稿では,APR-RPRタスクの改善と,航空機やハンドヘルド機器のRPR-RPRタスクの改善について述べる。
論文 参考訳(メタデータ) (2022-08-01T15:05:26Z) - Back to MLP: A Simple Baseline for Human Motion Prediction [59.18776744541904]
本稿では、歴史的に観察されたシーケンスから将来の身体のポーズを予測することによる、人間の動作予測の課題に取り組む。
これらの手法の性能は、0.14Mパラメータしか持たない軽量で純粋にアーキテクチャアーキテクチャによって超えることができることを示す。
Human3.6M, AMASS, 3DPWデータセットの徹底的な評価は, siMLPeをダブした我々の手法が, 他のアプローチよりも一貫して優れていることを示している。
論文 参考訳(メタデータ) (2022-07-04T16:35:58Z) - ReCLIP: A Strong Zero-Shot Baseline for Referring Expression
Comprehension [114.85628613911713]
大規模事前学習モデルは領域間の画像分類に有用である。
ReCLIPは単純だが強力なゼロショットベースラインであり、ReCのための最先端の大規模モデルであるCLIPを再利用する。
論文 参考訳(メタデータ) (2022-04-12T17:55:38Z) - Finding Geometric Models by Clustering in the Consensus Space [61.65661010039768]
本稿では,未知数の幾何学的モデル,例えばホモグラフィーを求めるアルゴリズムを提案する。
複数の幾何モデルを用いることで精度が向上するアプリケーションをいくつか提示する。
これには、複数の一般化されたホモグラフからのポーズ推定、高速移動物体の軌道推定が含まれる。
論文 参考訳(メタデータ) (2021-03-25T14:35:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。