論文の概要: PoseCompass: Intelligent Synthetic Pose Selection for Visual Localization
- arxiv url: http://arxiv.org/abs/2605.12144v1
- Date: Tue, 12 May 2026 14:02:58 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-13 21:48:56.897517
- Title: PoseCompass: Intelligent Synthetic Pose Selection for Visual Localization
- Title(参考訳): PoseCompass:ビジュアルローカライゼーションのためのインテリジェントな合成詩選択
- Authors: Yanan Zhou, Zhaoyan Qian, Yanli Li, Nan Yang, Zhongliang Guo, Dong Yuan,
- Abstract要約: 視覚的ローカライゼーションにおいて、Absolute Pose Regression (APR)は、単一の画像からリアルタイムの6-DoFカメラのポーズ推論を可能にする。
3DGSベースのAPRのためのインテリジェントなポーズ選択パイプラインであるPoseを提案する。
7シーンでPoseを評価し、適応時間を15.2分から5.1分に短縮し、3倍のスピードアップを行い、中央値のポーズエラーを53.8%削減した。
- 参考スコア(独自算出の注目度): 9.71854251744783
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In visual localization, Absolute Pose Regression (APR) enables real-time 6-DoF camera pose inference from single images, yet critically depends on fine-tuning data quality and coverage. While recent methods leverage 3D Gaussian Splatting (3DGS) for novel view synthesis-based data augmentation, random sampling generates redundant views and noisy samples from poorly reconstructed regions. To mitigate this research gap, we propose PoseCompass, an intelligent pose selection pipeline for 3DGS-based APR. PoseCompass formulates synthetic pose selection and derives a value-based pose ranking mechanism to identify informative poses. The ranking integrates three dimensions: Localization Difficulty, favoring challenging regions; Coverage Novelty, exploring under-sampled areas; and Rendering Observability, filtering artifacts and noise. PoseCompass then generates trajectory-constrained candidates, selects the top-K ranked poses, and synthesizes views using 3DGS with lightweight diffusion-based alignment. Finally, the pose regressor is fine-tuned on mixed real and synthetic data. We evaluate PoseCompass on 7-Scenes, where it reduces adaptation time from 15.2 to 5.1 minutes, a 3x speedup, while cutting median pose errors by 53.8 percent and significantly outperforming random baselines.
- Abstract(参考訳): 視覚的ローカライゼーションでは、Absolute Pose Regression (APR)は、単一の画像からリアルタイムの6-DoFカメラのポーズ推論を可能にする。
近年の手法では、3次元ガウススティング(3DGS)を新しいビュー合成に基づくデータ拡張に利用しているが、ランダムサンプリングでは、貧弱な再構成領域から冗長なビューとノイズの多いサンプルを生成する。
この研究ギャップを軽減するため、3DGSベースのAPRのためのインテリジェントなポーズ選択パイプラインであるPoseCompassを提案する。
PoseCompassは合成ポーズ選択を定式化し、情報的ポーズを特定するために値ベースのポーズランキングメカニズムを導出する。
ランク付けには3つの次元が組み込まれている: ローカライゼーションが困難で、困難な地域を好むこと、カバーノベルティ、アンダーサンプされた地域を探索すること、監視可能性のレンダリング、アーティファクトのフィルタリング、ノイズ。
PoseCompassはその後、軌道制約付き候補を生成し、上位Kランクのポーズを選択し、3DGSを使ってビューを軽量な拡散ベースのアライメントで合成する。
最後に、ポーズ回帰器は実データと合成データを混合して微調整される。
本研究では,PoseCompassを7シーンで評価し,適応時間を15.2分から5.1分に短縮し,中央値のポーズ誤差を53.8%削減し,ランダムなベースラインを著しく上回った。
関連論文リスト
- Camera Pose Refinement via 3D Gaussian Splatting [9.142303730601162]
カメラポーズ補正は,3次元コンピュータビジョンにおける初期ポーズ推定の精度向上を目的としている。
3次元ガウススプラッティングを利用した新しいカメラポーズ改善フレームワーク(3DGS)を提案する。
本手法は,7シーンとケンブリッジ・ランドマークス・データセットの中央値翻訳と回転誤差を53.3%,56.9%削減する。
論文 参考訳(メタデータ) (2025-08-25T10:29:59Z) - AnySplat: Feed-forward 3D Gaussian Splatting from Unconstrained Views [68.94737256959661]
AnySplatは、未校正画像コレクションから新しいビューを合成するためのフィードフォワードネットワークである。
単一のフォワードパスは、シーン幾何学と外観の両方をコードする3Dガウスプリミティブのセットを生成する。
広範囲なゼロショット評価では、AnySplatはスパースと高密度の両方のビューシナリオにおいて、ポーズを意識するベースラインの品質にマッチする。
論文 参考訳(メタデータ) (2025-05-29T17:49:56Z) - No Pose, No Problem: Surprisingly Simple 3D Gaussian Splats from Sparse Unposed Images [100.80376573969045]
NoPoSplatは、多視点画像から3Dガウスアンによってパラメータ化された3Dシーンを再構成できるフィードフォワードモデルである。
提案手法は,推定時にリアルタイムな3次元ガウス再構成を実現する。
この研究は、ポーズフリーの一般化可能な3次元再構成において大きな進歩をもたらし、実世界のシナリオに適用可能であることを示す。
論文 参考訳(メタデータ) (2024-10-31T17:58:22Z) - PF3plat: Pose-Free Feed-Forward 3D Gaussian Splatting [54.7468067660037]
PF3platは、設計選択を検証した包括的なアブレーション研究によってサポートされた、すべてのベンチマークに新しい最先端を設定します。
本フレームワークは,3DGSの高速,スケーラビリティ,高品質な3D再構成とビュー合成機能を活用している。
論文 参考訳(メタデータ) (2024-10-29T15:28:15Z) - GS-CPR: Efficient Camera Pose Refinement via 3D Gaussian Splatting [25.780452115246245]
本稿では,新しいテストタイムカメラ・ポーズ・リファインメント(CPR)フレームワーク,GS-CPRを提案する。
このフレームワークは、最先端の絶対ポーズ回帰とシーン座標回帰法の局所化精度を高める。
3DGSモデルは高品質な合成画像と深度マップを描画し、2D-3D対応の確立を容易にする。
論文 参考訳(メタデータ) (2024-08-20T17:58:23Z) - Non-Local Latent Relation Distillation for Self-Adaptive 3D Human Pose
Estimation [63.199549837604444]
3次元ポーズ推定アプローチは、強い(2D/3Dポーズ)または弱い(複数ビューまたは深さ)ペアによる監督の異なる形態を利用する。
我々は3Dポーズ学習を,ラベル付きソースドメインから完全に損なわれないターゲットへのタスク知識の転送を目的とした,自己指導型適応問題として捉えた。
我々は、異なる自己適応設定を評価し、標準ベンチマークで最先端の3Dポーズ推定性能を示す。
論文 参考訳(メタデータ) (2022-04-05T03:52:57Z) - PoseAug: A Differentiable Pose Augmentation Framework for 3D Human Pose
Estimation [83.50127973254538]
既存の3D人間のポーズ推定器は、新しいデータセットへの一般化性能が悪い。
PoseAugは、より多くの多様性に向けて利用可能なトレーニングのポーズを強化することを学ぶ新しい自動増強フレームワークです。
論文 参考訳(メタデータ) (2021-05-06T06:57:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。