論文の概要: Improving Worst Case Visual Localization Coverage via Place-specific
Sub-selection in Multi-camera Systems
- arxiv url: http://arxiv.org/abs/2206.13883v1
- Date: Tue, 28 Jun 2022 10:59:39 GMT
- ステータス: 処理完了
- システム内更新日: 2022-06-29 13:08:25.027647
- Title: Improving Worst Case Visual Localization Coverage via Place-specific
Sub-selection in Multi-camera Systems
- Title(参考訳): マルチカメラシステムにおける位置特異的サブセレクションによる最悪の視覚定位範囲の改善
- Authors: Stephen Hausler, Ming Xu, Sourav Garg, Punarjay Chakravarty, Shubham
Shrivastava, Ankit Vora, Michael Milford
- Abstract要約: 6-DoFビジュアルローカライゼーションシステムは,3次元形状に根ざした原理的アプローチを用いて,地図上の画像の正確なカメラポーズ推定を行う。
オフザシェルフパイプラインに比べて,最悪のローカライゼーション性能が大幅に向上した。
提案手法は,特に自動運転車のクラウドシェアリングモデルに適用可能である。
- 参考スコア(独自算出の注目度): 29.519262914510396
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: 6-DoF visual localization systems utilize principled approaches rooted in 3D
geometry to perform accurate camera pose estimation of images to a map. Current
techniques use hierarchical pipelines and learned 2D feature extractors to
improve scalability and increase performance. However, despite gains in typical
recall@0.25m type metrics, these systems still have limited utility for
real-world applications like autonomous vehicles because of their `worst' areas
of performance - the locations where they provide insufficient recall at a
certain required error tolerance. Here we investigate the utility of using
`place specific configurations', where a map is segmented into a number of
places, each with its own configuration for modulating the pose estimation
step, in this case selecting a camera within a multi-camera system. On the Ford
AV benchmark dataset, we demonstrate substantially improved worst-case
localization performance compared to using off-the-shelf pipelines - minimizing
the percentage of the dataset which has low recall at a certain error
tolerance, as well as improved overall localization performance. Our proposed
approach is particularly applicable to the crowdsharing model of autonomous
vehicle deployment, where a fleet of AVs are regularly traversing a known
route.
- Abstract(参考訳): 6-dof視覚定位システムは3次元幾何学に基づく原理的アプローチを用いて、地図への画像の正確なカメラポーズ推定を行う。
現在の技術では、階層パイプラインと学習された2D特徴抽出器を使用してスケーラビリティを改善し、パフォーマンスを向上させる。
しかし、典型的なリコール@0.25mタイプのメトリクスは向上したが、これらのシステムは、性能の「悪い」領域のため、自動運転車のような実世界のアプリケーションでは、まだ使用できない。
本稿では,マルチカメラシステムにおけるカメラ選択において,マップを複数の場所に分割し,それぞれがポーズ推定ステップを変調する独自の構成を持つ 'place specific configurations' の使用の有用性について検討する。
ford avベンチマークデータセットでは、市販のパイプラインと比較して、最悪の場合のローカライズ性能が大幅に向上していることが示されています。
提案手法は,AVの艦隊が既知のルートを定期的に横断する,自動運転車のクラウドシェアリングモデルに適用可能である。
関連論文リスト
- Neural Semantic Map-Learning for Autonomous Vehicles [85.8425492858912]
本稿では,道路環境のコヒーレントな地図を作成するために,車両群から収集した局所部分写像を中心インスタンスに融合するマッピングシステムを提案する。
本手法は,シーン特異的なニューラルサイン距離場を用いて,雑音と不完全局所部分写像を併用する。
我々は,記憶効率の高いスパース機能グリッドを活用して大規模にスケールし,シーン再構築における不確実性をモデル化するための信頼スコアを導入する。
論文 参考訳(メタデータ) (2024-10-10T10:10:03Z) - SplatLoc: 3D Gaussian Splatting-based Visual Localization for Augmented Reality [50.179377002092416]
より少ないパラメータで高品質なレンダリングが可能な効率的なビジュアルローカライズ手法を提案する。
提案手法は,最先端の暗黙的視覚的ローカライゼーションアプローチに対して,より優れた,あるいは同等なレンダリングとローカライゼーション性能を実現する。
論文 参考訳(メタデータ) (2024-09-21T08:46:16Z) - Structured Pruning for Efficient Visual Place Recognition [24.433604332415204]
視覚的位置認識(VPR)は、ロボットや機器のグローバルな再ローカライズに欠かせない。
本稿では,共通VPRアーキテクチャを合理化するための新しい構造化プルーニング手法を提案する。
この二重焦点はシステムの効率を大幅に向上させ、マップとモデルメモリの要求を減らし、特徴抽出と検索待ち時間を短縮する。
論文 参考訳(メタデータ) (2024-09-12T08:32:25Z) - FaVoR: Features via Voxel Rendering for Camera Relocalization [23.7893950095252]
カメラ再ローカライズ手法は、高密度画像アライメントから、クエリ画像からの直接カメラポーズ回帰まで様々である。
本稿では,世界規模で疎密だが局所的に密集した2次元特徴の3次元表現を活用する新しい手法を提案する。
一連のフレーム上でのランドマークの追跡と三角測量により、追跡中に観察された画像パッチ記述子をレンダリングするために最適化されたスパースボクセルマップを構築する。
論文 参考訳(メタデータ) (2024-09-11T18:58:16Z) - LoLep: Single-View View Synthesis with Locally-Learned Planes and
Self-Attention Occlusion Inference [66.45326873274908]
本稿では,1枚のRGB画像から局所学習平面を回帰してシーンを正確に表現するLoLepを提案する。
MINEと比較して、LPIPSは4.8%-9.0%、RVは73.9%-83.5%である。
論文 参考訳(メタデータ) (2023-07-23T03:38:55Z) - Fast and Lightweight Scene Regressor for Camera Relocalization [1.6708069984516967]
プレビルドされた3Dモデルに対して直接カメラのポーズを推定することは、いくつかのアプリケーションにとって違法にコストがかかる可能性がある。
本研究では,シーン座標のマッピングに多層パーセプトロンネットワークのみを必要とする簡易なシーン回帰手法を提案する。
提案手法では,高密度のRGB画像ではなく,スパースディスクリプタを用いてシーン座標を回帰する。
論文 参考訳(メタデータ) (2022-12-04T14:41:20Z) - Monocular BEV Perception of Road Scenes via Front-to-Top View Projection [57.19891435386843]
本稿では,鳥の目視で道路配置と車両占有率によって形成された局所地図を再構築する新しい枠組みを提案する。
我々のモデルは1つのGPU上で25FPSで動作し、リアルタイムパノラマHDマップの再構築に有効である。
論文 参考訳(メタデータ) (2022-11-15T13:52:41Z) - A comparison of uncertainty estimation approaches for DNN-based camera
localization [6.053739577423792]
本研究はモンテカルロ・ドロップアウト(MCD)、ディープ・アンサンブル(DE)、ディープ・エビデンシャル・レグレッション(DER)の3つの不確実性推定手法の性能を比較した。
精度の高いカメラのローカライゼーションとキャリブレーションの不確実性を実現し,ある手法がローカライズ故障の検出に有効であることを示す。
論文 参考訳(メタデータ) (2022-11-02T16:15:28Z) - Coarse-to-fine Semantic Localization with HD Map for Autonomous Driving
in Structural Scenes [1.1024591739346292]
カメラを主センサとする自動運転のためのHDマップを用いたコスト効率の高い車両位置決めシステムを提案する。
視覚的セマンティクスをHDマップのランドマークにマップするデータアソシエーション問題として視覚に基づくローカライゼーションを定式化する。
本手法を2つのデータセット上で評価し,提案手法が異なる運転シナリオにおいて有望なローカライゼーション結果をもたらすことを示す。
論文 参考訳(メタデータ) (2021-07-06T11:58:55Z) - Learning Condition Invariant Features for Retrieval-Based Localization
from 1M Images [85.81073893916414]
我々は、より正確で、より一般化されたローカライゼーション特徴を学習する新しい方法を開発した。
難易度の高いオックスフォード・ロボットカーの夜間条件では、5m以内の局所化精度でよく知られた三重項損失を24.4%上回っている。
論文 参考訳(メタデータ) (2020-08-27T14:46:22Z) - Multi-View Optimization of Local Feature Geometry [70.18863787469805]
本研究では,複数視点からの局所像の特徴の幾何を,未知のシーンやカメラの幾何を伴わずに精査する問題に対処する。
提案手法は,従来の特徴抽出とマッチングのパラダイムを自然に補完する。
本手法は,手作りと学習の両方の局所的特徴に対して,三角測量とカメラのローカライゼーション性能を常に向上することを示す。
論文 参考訳(メタデータ) (2020-03-18T17:22:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。