論文の概要: Deep-Geometric 6 DoF Localization from a Single Image in Topo-metric
Maps
- arxiv url: http://arxiv.org/abs/2002.01210v1
- Date: Tue, 4 Feb 2020 10:11:46 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-04 03:17:22.408684
- Title: Deep-Geometric 6 DoF Localization from a Single Image in Topo-metric
Maps
- Title(参考訳): トポメトリックマップにおける単一画像からの深部幾何学的6DF位置決め
- Authors: Tom Roussel, Punarjay Chakravarty, Gaurav Pandey, Tinne Tuytelaars,
Luc Van Eycken
- Abstract要約: 本稿では,1枚の画像から全6自由度(DoF)グローバルポーズを推定できるDeep-Geometric Localizerについて述べる。
本手法は, マッピングアルゴリズムと局所化アルゴリズム(ステレオとモノ)を分離し, 予めマッピングした環境下での正確な6自由度ポーズ推定を可能にする。
携帯電話やドローンなどの単一カメラデバイスでのVR/ARとローカライズアプリケーションにより、私たちのハイブリッドアルゴリズムは、完全なDeep-LearningベースのPose-Netと比較できる。
- 参考スコア(独自算出の注目度): 39.05304338751328
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We describe a Deep-Geometric Localizer that is able to estimate the full 6
Degree of Freedom (DoF) global pose of the camera from a single image in a
previously mapped environment. Our map is a topo-metric one, with discrete
topological nodes whose 6 DoF poses are known. Each topo-node in our map also
comprises of a set of points, whose 2D features and 3D locations are stored as
part of the mapping process. For the mapping phase, we utilise a stereo camera
and a regular stereo visual SLAM pipeline. During the localization phase, we
take a single camera image, localize it to a topological node using Deep
Learning, and use a geometric algorithm (PnP) on the matched 2D features (and
their 3D positions in the topo map) to determine the full 6 DoF globally
consistent pose of the camera. Our method divorces the mapping and the
localization algorithms and sensors (stereo and mono), and allows accurate 6
DoF pose estimation in a previously mapped environment using a single camera.
With potential VR/AR and localization applications in single camera devices
such as mobile phones and drones, our hybrid algorithm compares favourably with
the fully Deep-Learning based Pose-Net that regresses pose from a single image
in simulated as well as real environments.
- Abstract(参考訳): 本稿では,カメラの6自由度(dof)の全体像を,予めマッピングされた環境における1つの画像から推定可能な,深部地理ローカライザについて述べる。
我々の地図はトポメトリックであり、6つのDoFポーズが知られている離散位相ノードを持つ。
マップの各topoノードは、2d特徴と3d位置がマッピングプロセスの一部として格納される一連のポイントで構成されています。
マッピングフェーズでは、ステレオカメラと通常のステレオビジュアルスラムパイプラインを使用します。
ローカライゼーションフェーズでは,1枚のカメライメージをDeep Learningを用いてトポロジカルノードにローカライズし,マッチングした2D特徴(およびトポマップにおけるそれらの3D位置)の幾何アルゴリズム(PnP)を用いて,カメラの全6DoFのグローバルな一貫したポーズを決定する。
本手法は,マッピングと位置決めアルゴリズムとセンサ(stereoとmono)を分離し,単一のカメラを用いて,予めマッピングした環境で正確な6自由度位置推定を可能にする。
携帯電話やドローンなどの単一カメラデバイスにおけるVR/ARやローカライゼーションの応用の可能性を考えると、私たちのハイブリッドアルゴリズムは、シミュレーションや実環境における単一の画像からのポーズを回帰する完全なDeep-LearningベースのPose-Netと好適に比較できる。
関連論文リスト
- RelPose++: Recovering 6D Poses from Sparse-view Observations [66.6922660401558]
スパースビュー画像集合(2-8画像)から6次元カメラポーズを推定する作業に対処する。
我々は,画像対上の相対回転よりも分布を推定するネットワークを学習するRelPoseフレームワークを構築した。
最終システムは,先行技術よりも6次元ポーズ予測を大幅に改善する。
論文 参考訳(メタデータ) (2023-05-08T17:59:58Z) - CyberLoc: Towards Accurate Long-term Visual Localization [14.883028430847714]
CyberLocは画像ベースの視覚的ローカライゼーションパイプラインで、困難な条件下での堅牢で正確な長期推定を行う。
マッピングモジュールを適用して、異なる条件下で複数のシーケンスが存在する場合、各参照シーケンスの1つのマップであるシーンの正確な3Dマップを構築する。
単一画像ベースのローカライゼーションパイプラインを実行し、クエリ画像毎に6-DoFカメラのポーズを推定する。
論文 参考訳(メタデータ) (2023-01-06T06:49:36Z) - Neural Correspondence Field for Object Pose Estimation [67.96767010122633]
1枚のRGB画像から3次元モデルで剛体物体の6DoFポーズを推定する手法を提案する。
入力画像の画素で3次元オブジェクト座標を予測する古典的対応法とは異なり,提案手法はカメラフラストラムでサンプリングされた3次元クエリポイントで3次元オブジェクト座標を予測する。
論文 参考訳(メタデータ) (2022-07-30T01:48:23Z) - Coupled Iterative Refinement for 6D Multi-Object Pose Estimation [64.7198752089041]
既知の3DオブジェクトのセットとRGBまたはRGB-Dの入力画像から、各オブジェクトの6Dポーズを検出して推定する。
我々のアプローチは、ポーズと対応を緊密に結合した方法で反復的に洗練し、アウトレーヤを動的に除去して精度を向上させる。
論文 参考訳(メタデータ) (2022-04-26T18:00:08Z) - TerrainMesh: Metric-Semantic Terrain Reconstruction from Aerial Images
Using Joint 2D-3D Learning [20.81202315793742]
本稿では,視覚的オドメトリーアルゴリズムによって保持される各カメラにおける局所的メートル法-セマンティックメッシュを再構築する2次元3次元学習手法を提案する。
メッシュはグローバル環境モデルに組み立てて、オンライン操作中の地形のトポロジとセマンティクスをキャプチャすることができる。
論文 参考訳(メタデータ) (2022-04-23T05:18:39Z) - Deep Camera Pose Regression Using Pseudo-LiDAR [1.5959408994101303]
我々は、奥行きマップを擬似LiDAR信号に変換することが、カメラのローカライゼーションタスクのより良い表現であることを示す。
擬似LiDARを用いて6DOFカメラのポーズを復元する新しいアーキテクチャであるFusionLocを提案する。
論文 参考訳(メタデータ) (2022-02-28T20:30:37Z) - Multi-View Multi-Person 3D Pose Estimation with Plane Sweep Stereo [71.59494156155309]
既存のマルチビュー3Dポーズ推定手法は、複数のカメラビューからグループ2Dポーズ検出に対するクロスビュー対応を明確に確立する。
平面スイープステレオに基づくマルチビュー3Dポーズ推定手法を提案し、クロスビュー融合と3Dポーズ再構築を1ショットで共同で解決します。
論文 参考訳(メタデータ) (2021-04-06T03:49:35Z) - Back to the Feature: Learning Robust Camera Localization from Pixels to
Pose [114.89389528198738]
画像と3Dモデルから正確な6-DoFのポーズを推定するシーンに依存しないニューラルネットワークPixLocを導入する。
このシステムは、粗いポーズ前の大きな環境でもローカライズできるが、スパース特徴マッチングの精度も向上する。
論文 参考訳(メタデータ) (2021-03-16T17:40:12Z) - Mesh Reconstruction from Aerial Images for Outdoor Terrain Mapping Using
Joint 2D-3D Learning [12.741811850885309]
本稿では,無人航空機から得られた頭上画像を用いて,屋外地形のマッピングを行う。
飛行中の航空画像からの深度推定は困難です。
各カメラの局所メッシュを再構成する2d-3d学習手法を共同開発し,地球環境モデルとして構築する。
論文 参考訳(メタデータ) (2021-01-06T02:09:03Z) - L6DNet: Light 6 DoF Network for Robust and Precise Object Pose
Estimation with Small Datasets [0.0]
1枚のRGB-D画像から6つのDoFオブジェクトのポーズ推定を行う新しい手法を提案する。
データ駆動と幾何学という2段階のハイブリッドパイプラインを採用しています。
私たちのアプローチは最先端の手法よりも堅牢で正確です。
論文 参考訳(メタデータ) (2020-02-03T17:41:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。