論文の概要: Dense Semantic 3D Map Based Long-Term Visual Localization with Hybrid
Features
- arxiv url: http://arxiv.org/abs/2005.10766v1
- Date: Thu, 21 May 2020 16:36:37 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-30 23:49:06.961578
- Title: Dense Semantic 3D Map Based Long-Term Visual Localization with Hybrid
Features
- Title(参考訳): ハイブリッド特徴量を用いたDense Semantic 3D Mapに基づく長期視覚像定位
- Authors: Tianxin Shi, Hainan Cui, Zhuo Song, Shuhan Shen
- Abstract要約: そこで本研究では,密集したセマンティック3Dマップを用いた手工芸と学習のハイブリッド特徴を用いた新しい視覚的位置決め手法を提案する。
長期ベンチマークテストでは, 最先端の解法と比較して, 提案手法の有効性が示された。
- 参考スコア(独自算出の注目度): 5.5984870003693645
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Visual localization plays an important role in many applications. However,
due to the large appearance variations such as season and illumination changes,
as well as weather and day-night variations, it's still a big challenge for
robust long-term visual localization algorithms. In this paper, we present a
novel visual localization method using hybrid handcrafted and learned features
with dense semantic 3D map. Hybrid features help us to make full use of their
strengths in different imaging conditions, and the dense semantic map provide
us reliable and complete geometric and semantic information for constructing
sufficient 2D-3D matching pairs with semantic consistency scores. In our
pipeline, we retrieve and score each candidate database image through the
semantic consistency between the dense model and the query image. Then the
semantic consistency score is used as a soft constraint in the weighted
RANSAC-based PnP pose solver. Experimental results on long-term visual
localization benchmarks demonstrate the effectiveness of our method compared
with state-of-the-arts.
- Abstract(参考訳): 視覚的ローカライゼーションは多くのアプリケーションにおいて重要な役割を果たす。
しかし、季節や照明の変化や天気や昼夜の変動など、外観の変化が大きいため、長期の視覚的ローカライズアルゴリズムでは依然として大きな課題となっている。
本稿では,高密度なセマンティック3Dマップを用いたハイブリッドハンドクラフトと学習特徴を用いた視覚的位置決め手法を提案する。
ハイブリッドな特徴は、異なる画像条件下でそれらの強みをフル活用するのに役立ち、密密なセマンティックマップは、十分な2D-3Dマッチングペアとセマンティック一貫性スコアを構築するための信頼性と完全な幾何学的および意味情報を提供する。
パイプラインでは,高密度モデルと問合せ画像間のセマンティック一貫性を利用して,各候補データベース画像の検索とスコア付けを行う。
そして、重み付けされたRANSACベースのPnPポーズソルバにおいて、意味一貫性スコアをソフト制約として使用する。
長期ビジュアルローカライゼーションベンチマークによる実験結果から,本手法の有効性が示された。
関連論文リスト
- Large Spatial Model: End-to-end Unposed Images to Semantic 3D [79.94479633598102]
大空間モデル(LSM)は、RGB画像を直接意味的放射場に処理する。
LSMは、単一のフィードフォワード操作における幾何学、外観、意味を同時に推定する。
新しい視点で言語と対話することで、多目的ラベルマップを生成することができる。
論文 参考訳(メタデータ) (2024-10-24T17:54:42Z) - SeCG: Semantic-Enhanced 3D Visual Grounding via Cross-modal Graph
Attention [19.23636231942245]
設計したメモリグラフアテンション層を用いたグラフネットワークに基づくセマンティック・エンハンスド・リレーショナル学習モデルを提案する。
本手法は,従来の言語に依存しないエンコーディングを,視覚解析におけるクロスモーダルエンコーディングに置き換える。
ReferIt3D と ScanRefer のベンチマーク実験の結果,提案手法は既存の最先端手法よりも優れていた。
論文 参考訳(メタデータ) (2024-03-13T02:11:04Z) - Learning to Produce Semi-dense Correspondences for Visual Localization [11.415451542216559]
本研究は,夜間シナリオ,悪天候,季節変化などの要求条件下で視覚的局所化を行うことの課題に対処する。
本稿では,高密度なキーポイントマッチングに基づいて,信頼性の高い半高密度2D-3Dマッチングポイントを抽出する手法を提案する。
ネットワークは幾何学的および視覚的な手がかりを用いて、観測されたキーポイントから観測されていないキーポイントの3D座標を効果的に推測する。
論文 参考訳(メタデータ) (2024-02-13T10:40:10Z) - Volumetric Semantically Consistent 3D Panoptic Mapping [77.13446499924977]
非構造環境における自律エージェントに適したセマンティック3Dマップを生成することを目的としたオンライン2次元から3次元のセマンティック・インスタンスマッピングアルゴリズムを提案する。
マッピング中にセマンティック予測の信頼性を統合し、セマンティックおよびインスタンス一貫性のある3D領域を生成する新しい方法を導入する。
提案手法は,パブリックな大規模データセット上での最先端の精度を実現し,多くの広く使用されているメトリクスを改善した。
論文 参考訳(メタデータ) (2023-09-26T08:03:10Z) - Neural Semantic Surface Maps [52.61017226479506]
本稿では,2つの属とゼロの形状の地図を自動計算する手法を提案する。
提案手法は,手動のアノテーションや3Dトレーニングデータ要求を排除し,意味的表面-表面マップを生成する。
論文 参考訳(メタデータ) (2023-09-09T16:21:56Z) - SeMLaPS: Real-time Semantic Mapping with Latent Prior Networks and
Quasi-Planar Segmentation [53.83313235792596]
本稿では,RGB-Dシーケンスからのリアルタイム意味マッピングのための新しい手法を提案する。
2DニューラルネットワークとSLAMシステムに基づく3Dネットワークと3D占有マッピングを組み合わせる。
本システムは,2D-3Dネットワークベースシステムにおいて,最先端のセマンティックマッピング品質を実現する。
論文 参考訳(メタデータ) (2023-06-28T22:36:44Z) - Improving Feature-based Visual Localization by Geometry-Aided Matching [21.1967752160412]
外観情報と幾何学的文脈の両方を用いて2D-3D特徴マッチングを改善する新しい2D-3Dマッチング手法であるGeometry-Aided Matching (GAM)を導入する。
GAMは高精度を維持しながら2D-3Dマッチのリコールを大幅に強化することができる。
提案手法は,複数の視覚的ローカライゼーションデータセットの最先端結果を実現する。
論文 参考訳(メタデータ) (2022-11-16T07:02:12Z) - Sparse Semantic Map-Based Monocular Localization in Traffic Scenes Using
Learned 2D-3D Point-Line Correspondences [29.419138863851526]
クエリー画像が与えられた場合、カメラのポーズが先行マップに対応すると見積もることが目的である。
既存のアプローチは、登録問題を解決するために、機能レベルでの高密度な点記述子に大きく依存している。
本稿では,よく設計されたディープニューラルネットワークを用いて2D-3D登録を行う,スパースセマンティックマップに基づく単眼位置推定法を提案する。
論文 参考訳(メタデータ) (2022-10-10T10:29:07Z) - TANDEM: Tracking and Dense Mapping in Real-time using Deep Multi-view
Stereo [55.30992853477754]
本稿では,リアルタイムな単分子追跡と高密度フレームワークであるTANDEMを紹介する。
ポーズ推定のために、TANDEMはアライメントのスライディングウィンドウに基づいて光度バンドル調整を行う。
TANDEMは最先端のリアルタイム3D再構成性能を示す。
論文 参考訳(メタデータ) (2021-11-14T19:01:02Z) - Multi-view Depth Estimation using Epipolar Spatio-Temporal Networks [87.50632573601283]
一つのビデオから多視点深度を推定する新しい手法を提案する。
提案手法は,新しいEpipolar Spatio-Temporal Transformer(EST)を用いて時間的コヒーレントな深度推定を行う。
最近のMixture-of-Expertsモデルにインスパイアされた計算コストを削減するため、我々はコンパクトなハイブリッドネットワークを設計する。
論文 参考訳(メタデータ) (2020-11-26T04:04:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。