論文の概要: Geometric Structure Aided Visual Inertial Localization
- arxiv url: http://arxiv.org/abs/2011.04173v1
- Date: Mon, 9 Nov 2020 03:48:39 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-28 02:02:08.391669
- Title: Geometric Structure Aided Visual Inertial Localization
- Title(参考訳): 視覚慣性局在を補助する幾何学的構造
- Authors: Huaiyang Huang, Haoyang Ye, Jianhao Jiao, Yuxiang Sun, Ming Liu
- Abstract要約: 計算コストを削減し、位置決め精度を高めるために、ハイブリッドマップ表現に基づく完全な視覚的位置決めシステムを提案する。
バッチ最適化では、視覚的要因を使わずに、インスタントローカライゼーション結果に先立ってポーズを推定するモジュールを開発する。
EuRoC MAVデータセットの実験結果は、芸術の状況と比較して、競争力のある性能を示している。
- 参考スコア(独自算出の注目度): 24.42071242531681
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Visual Localization is an essential component in autonomous navigation.
Existing approaches are either based on the visual structure from SLAM/SfM or
the geometric structure from dense mapping. To take the advantages of both, in
this work, we present a complete visual inertial localization system based on a
hybrid map representation to reduce the computational cost and increase the
positioning accuracy. Specially, we propose two modules for data association
and batch optimization, respectively. To this end, we develop an efficient data
association module to associate map components with local features, which takes
only $2$ms to generate temporal landmarks. For batch optimization, instead of
using visual factors, we develop a module to estimate a pose prior from the
instant localization results to constrain poses. The experimental results on
the EuRoC MAV dataset demonstrate a competitive performance compared to the
state of the arts. Specially, our system achieves an average position error in
1.7 cm with 100% recall. The timings show that the proposed modules reduce the
computational cost by 20-30%. We will make our implementation open source at
http://github.com/hyhuang1995/gmmloc.
- Abstract(参考訳): 視覚局在は自律ナビゲーションにおいて必須の要素である。
既存のアプローチはSLAM/SfMの視覚構造や密集写像の幾何学構造に基づいている。
本研究の利点を両立させるために,ハイブリッドマップ表現に基づく完全視覚慣性局所化システムを提案し,計算コストの低減と位置決め精度の向上を図る。
特に,データアソシエーションとバッチ最適化のための2つのモジュールを提案する。
この目的のために,地図成分と局所特徴を関連付ける効率的なデータアソシエーションモジュールを開発し,時間的ランドマークを生成するのにわずか2$msしかかからない。
バッチ最適化では,視覚的な要因を使わずに,瞬間的局所化結果より先にポーズを推定し,ポーズを制約するモジュールを開発した。
EuRoC MAVデータセットの実験結果は、芸術の状況と比較して競争力のある性能を示している。
特に,本システムは平均位置誤差を1.7cmとし,100%リコールを行う。
提案したモジュールは計算コストを20~30%削減する。
実装はhttp://github.com/hyhuang1995/gmmlocでオープンソースにします。
関連論文リスト
- OSMLoc: Single Image-Based Visual Localization in OpenStreetMap with Geometric and Semantic Guidances [11.085165252259042]
OSMLocは、脳にインスパイアされた単一画像の視覚的位置決め手法であり、精度、堅牢性、一般化能力を改善するための意味的および幾何学的ガイダンスを備えている。
提案したOSMLOCを検証するため,世界規模のクロスエリアとクロスコンディション(CC)のベンチマークを収集し,広範な評価を行う。
論文 参考訳(メタデータ) (2024-11-13T14:59:00Z) - SplatLoc: 3D Gaussian Splatting-based Visual Localization for Augmented Reality [50.179377002092416]
より少ないパラメータで高品質なレンダリングが可能な効率的なビジュアルローカライズ手法を提案する。
提案手法は,最先端の暗黙的視覚的ローカライゼーションアプローチに対して,より優れた,あるいは同等なレンダリングとローカライゼーション性能を実現する。
論文 参考訳(メタデータ) (2024-09-21T08:46:16Z) - Magic ELF: Image Deraining Meets Association Learning and Transformer [63.761812092934576]
本稿では,CNN と Transformer を統合化して,画像デライニングにおける学習のメリットを活用することを目的とする。
降雨除去と背景復旧を関連づける新しいマルチインプット・アテンション・モジュール (MAM) を提案する。
提案手法(ELF)は,最先端手法(MPRNet)を平均0.25dB向上させる。
論文 参考訳(メタデータ) (2022-07-21T12:50:54Z) - Structure PLP-SLAM: Efficient Sparse Mapping and Localization using
Point, Line and Plane for Monocular, RGB-D and Stereo Cameras [13.693353009049773]
本稿では,PPRモジュールを組み込んだ高機能カメラローカライゼーションを実現するために,ポイント・ライン・クラウドを用いた視界SLAMシステムを提案する。
再構成された線や平面上での複数の実行時最適化を提案することにより,幾何的プリミティブをスケールのあいまいさで再構築するという課題に対処する。
その結果,提案したSLAMはセマンティック機能をしっかりと組み込んで,トラッキングとバックエンドの最適化を強化していることがわかった。
論文 参考訳(メタデータ) (2022-07-13T09:05:35Z) - Learning Implicit Feature Alignment Function for Semantic Segmentation [51.36809814890326]
Implicit Feature Alignment Function (IFA)は、暗黙の神経表現の急速に拡大するトピックにインスパイアされている。
IFAは機能マップを異なるレベルで暗黙的に整列し、任意の解像度でセグメンテーションマップを生成することができることを示す。
提案手法は,様々なアーキテクチャの改善と組み合わせて,一般的なベンチマークにおける最先端の精度のトレードオフを実現する。
論文 参考訳(メタデータ) (2022-06-17T09:40:14Z) - FD-SLAM: 3-D Reconstruction Using Features and Dense Matching [18.577229381683434]
本稿では,高密度フレーム・モデル・オードメトリーを用いたRGB-D SLAMシステムを提案する。
マップ構築をさらに安定化させる3次元特徴に基づく学習ベースのループクロージャコンポーネントを組み込んだ。
このアプローチは、他のシステムがしばしば失敗する大きなシーンにも拡張できる。
論文 参考訳(メタデータ) (2022-03-25T18:58:46Z) - Rethinking Dilated Convolution for Real-time Semantic Segmentation [0.0]
背骨全体に大きな拡張率を持つ拡張畳み込みを用いて異なるアプローチをとる。
我々のモデルであるRegSegは、リアルタイムのCityscapesとCamVidデータセットの競合的な結果を達成する。
論文 参考訳(メタデータ) (2021-11-18T22:08:21Z) - Region Similarity Representation Learning [94.88055458257081]
Region similarity Representation Learning(ReSim)は、ローカリゼーションベースのタスクに対する自己監視型表現学習の新しいアプローチである。
ReSimはローカリゼーションのための地域表現とセマンティックイメージレベルの表現の両方を学びます。
競合するMoCo-v2ベースラインと比較して、ReSimがローカリゼーションと分類性能を大幅に向上させる表現をどのように学習するかを示します。
論文 参考訳(メタデータ) (2021-03-24T00:42:37Z) - GMMLoc: Structure Consistent Visual Localization with Gaussian Mixture
Models [23.72910988500612]
ガウス混合モデル(GMM)によりモデル化された先行マップにおけるカメラ追跡手法を提案する。
ポーズを最初にフロントエンドで推定すると、局所的な視覚観測とマップコンポーネントは効率的に関連付けられる。
計算オーバーヘッドの少ないセンチメートルレベルのローカライズ精度を実現する方法を示す。
論文 参考訳(メタデータ) (2020-06-24T12:41:03Z) - TAM: Temporal Adaptive Module for Video Recognition [60.83208364110288]
時間適応モジュール(bf TAM)は、自身の特徴マップに基づいてビデオ固有の時間カーネルを生成する。
Kinetics-400およびSomethingデータセットの実験は、我々のTAMが他の時間的モデリング手法より一貫して優れていることを示した。
論文 参考訳(メタデータ) (2020-05-14T08:22:45Z) - Augmented Parallel-Pyramid Net for Attention Guided Pose-Estimation [90.28365183660438]
本稿では、注意部分モジュールと微分可能な自動データ拡張を備えた拡張並列ピラミドネットを提案する。
我々は、データ拡張のシーケンスをトレーニング可能なCNNコンポーネントとして定式化する新しいポーズ検索空間を定義する。
特に,本手法は,挑戦的なCOCOキーポイントベンチマークとMPIIデータセットの最先端結果において,トップ1の精度を実現する。
論文 参考訳(メタデータ) (2020-03-17T03:52:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。