論文の概要: SF-Loc: A Visual Mapping and Geo-Localization System based on Sparse Visual Structure Frames
- arxiv url: http://arxiv.org/abs/2412.01500v1
- Date: Mon, 02 Dec 2024 13:51:58 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-04 15:42:34.954223
- Title: SF-Loc: A Visual Mapping and Geo-Localization System based on Sparse Visual Structure Frames
- Title(参考訳): SF-Loc:スパース視覚構造フレームに基づくビジュアルマッピングとジオローカライズシステム
- Authors: Yuxuan Zhou, Xingxing Li, Shengyu Li, Chunxi Xia, Xuanbin Wang, Shaoquan Feng,
- Abstract要約: 本稿では,軽量なビジュアルマッピングと地図支援型ローカライゼーションシステムであるSF-Locについて述べる。
マッピングフェーズでは,多センサ高密度バンドル調整(MS-DBA)を適用し,ジオレファレンスな視覚構造フレームを構築する。
ローカライズフェーズでは、多フレーム情報と地図分布を完全に統合した粗大な視覚に基づくローカライズを行う。
- 参考スコア(独自算出の注目度): 3.5047603107971397
- License:
- Abstract: For high-level geo-spatial applications and intelligent robotics, accurate global pose information is of crucial importance. Map-aided localization is an important and universal approach to overcome the limitations of global navigation satellite system (GNSS) in challenging environments. However, current solutions face challenges in terms of mapping flexibility, storage burden and re-localization performance. In this work, we present SF-Loc, a lightweight visual mapping and map-aided localization system, whose core idea is the map representation based on sparse frames with dense (though downsampled) depth, termed as visual structure frames. In the mapping phase, multi-sensor dense bundle adjustment (MS-DBA) is applied to construct geo-referenced visual structure frames. The local co-visbility is checked to keep the map sparsity and achieve incremental mapping. In the localization phase, coarse-to-fine vision-based localization is performed, in which multi-frame information and the map distribution are fully integrated. To be specific, the concept of spatially smoothed similarity (SSS) is proposed to overcome the place ambiguity, and pairwise frame matching is applied for efficient and robust pose estimation. Experimental results on both public and self-made datasets verify the effectiveness of the system. In complex urban road scenarios, the map size is down to 3 MB per kilometer and stable decimeter-level re-localization can be achieved. The code will be made open-source soon (https://github.com/GREAT-WHU/SF-Loc).
- Abstract(参考訳): 高レベルの地理空間アプリケーションやインテリジェントロボティクスでは、正確なグローバルポーズ情報が重要である。
地図支援型ローカライゼーションは,グローバルナビゲーション衛星システム(GNSS)の限界を克服するための重要かつ普遍的なアプローチである。
しかし、現在のソリューションでは、マッピングの柔軟性、ストレージの負担、再ローカライゼーションのパフォーマンスといった面で課題に直面している。
本研究では,軽量なビジュアルマッピングとマップ支援型ローカライゼーションシステムであるSF-Locについて述べる。
マッピングフェーズでは,多センサ高密度バンドル調整(MS-DBA)を適用し,ジオレファレンスな視覚構造フレームを構築する。
ローカルのコビジュアビリティをチェックして、マップの幅を保ち、インクリメンタルなマッピングを実現する。
ローカライズフェーズでは、多フレーム情報と地図分布を完全に統合した粗大な視覚に基づくローカライズを行う。
具体的には,空間的スムーズな類似性(SSS)の概念を,位置のあいまいさを克服するために提案し,一対のフレームマッチングを効率よくロバストなポーズ推定に応用した。
公開データセットと自己生成データセットの両方の実験結果から,システムの有効性が検証された。
複雑な都市道路のシナリオでは、地図のサイズは1kmあたり3MBまで減少し、安定したデシメータレベルの再局在を実現することができる。
コードはまもなくオープンソースになる(https://github.com/GREAT-WHU/SF-Loc)。
関連論文リスト
- LiteVLoc: Map-Lite Visual Localization for Image Goal Navigation [5.739362282280063]
LiteVLocは、環境を表現するために軽量のトポメトリックマップを使用する視覚的ローカライゼーションフレームワークである。
学習に基づく特徴マッチングと幾何学的解法を利用して、メートル法ポーズ推定をすることで、ストレージオーバーヘッドを低減する。
論文 参考訳(メタデータ) (2024-10-06T09:26:07Z) - Swarm Intelligence in Geo-Localization: A Multi-Agent Large Vision-Language Model Collaborative Framework [51.26566634946208]
smileGeoは、新しい視覚的ジオローカライゼーションフレームワークである。
エージェント間のコミュニケーションによって、SmithGeoはこれらのエージェントの固有の知識と、検索された情報を統合する。
その結果,本手法は現在の最先端手法よりも優れていた。
論文 参考訳(メタデータ) (2024-08-21T03:31:30Z) - Monocular Localization with Semantics Map for Autonomous Vehicles [8.242967098897408]
低レベルのテクスチャ機能の代わりに安定したセマンティック機能を利用する新しい視覚的セマンティックローカライゼーションアルゴリズムを提案する。
まず、セマンティックマップは、カメラやLiDARセンサーを使用して、グラウンドマーカー、レーンライン、ポールなどのセマンティックオブジェクトを検出してオフラインで構築される。
オンラインの視覚的ローカライゼーションは意味的特徴とマップオブジェクトのデータアソシエーションによって行われる。
論文 参考訳(メタデータ) (2024-06-06T08:12:38Z) - DBA-Fusion: Tightly Integrating Deep Dense Visual Bundle Adjustment with Multiple Sensors for Large-Scale Localization and Mapping [3.5047603107971397]
トレーニング可能な高密度バンドル調整(DBA)を因子グラフを通じて多センサ情報と密に統合する。
視覚-慣性統合のためのパイプラインが最初に開発され、メカニカルスケールのローカライゼーションとマッピングの最小限の能力を提供する。
その結果,大規模環境におけるリアルタイム高密度マッピングを実現する手法として,より優れたローカライゼーション性能が得られた。
論文 参考訳(メタデータ) (2024-03-20T16:20:54Z) - Mapping High-level Semantic Regions in Indoor Environments without
Object Recognition [50.624970503498226]
本研究では,屋内環境における埋め込みナビゲーションによる意味領域マッピング手法を提案する。
地域識別を実現するために,視覚言語モデルを用いて地図作成のためのシーン情報を提供する。
グローバルなフレームにエゴセントリックなシーン理解を投影することにより、提案手法は各場所の可能な領域ラベル上の分布としてのセマンティックマップを生成する。
論文 参考訳(メタデータ) (2024-03-11T18:09:50Z) - GeoCLIP: Clip-Inspired Alignment between Locations and Images for
Effective Worldwide Geo-localization [61.10806364001535]
世界規模のジオローカライゼーションは、地球上のどこでも撮影された画像の正確な位置を特定することを目的としている。
既存のアプローチは、地球を離散的な地理的細胞に分割し、問題を分類タスクに変換する。
画像と対応するGPS位置のアライメントを強制する新しいCLIPにインスパイアされた画像-GPS検索手法であるGeoCLIPを提案する。
論文 参考訳(メタデータ) (2023-09-27T20:54:56Z) - Lazy Visual Localization via Motion Averaging [89.8709956317671]
本研究では,データベースからシーンを再構築することなく,高精度なローカライゼーションを実現することができることを示す。
実験の結果、我々の視覚的ローカライゼーションの提案であるLazyLocは、最先端の構造に基づく手法に対して同等のパフォーマンスを実現していることがわかった。
論文 参考訳(メタデータ) (2023-07-19T13:40:45Z) - FD-SLAM: 3-D Reconstruction Using Features and Dense Matching [18.577229381683434]
本稿では,高密度フレーム・モデル・オードメトリーを用いたRGB-D SLAMシステムを提案する。
マップ構築をさらに安定化させる3次元特徴に基づく学習ベースのループクロージャコンポーネントを組み込んだ。
このアプローチは、他のシステムがしばしば失敗する大きなシーンにも拡張できる。
論文 参考訳(メタデータ) (2022-03-25T18:58:46Z) - Think Global, Act Local: Dual-scale Graph Transformer for
Vision-and-Language Navigation [87.03299519917019]
本稿では,2次元グラフ変換器 (DUET) を提案する。
我々は,グローバルな行動空間における効率的な探索を可能にするために,トポロジカルマップをオンザフライで構築する。
提案手法であるDUETは、目標指向の視覚・言語ナビゲーションベンチマークにおいて最先端の手法を著しく上回っている。
論文 参考訳(メタデータ) (2022-02-23T19:06:53Z) - Geometric Structure Aided Visual Inertial Localization [24.42071242531681]
計算コストを削減し、位置決め精度を高めるために、ハイブリッドマップ表現に基づく完全な視覚的位置決めシステムを提案する。
バッチ最適化では、視覚的要因を使わずに、インスタントローカライゼーション結果に先立ってポーズを推定するモジュールを開発する。
EuRoC MAVデータセットの実験結果は、芸術の状況と比較して、競争力のある性能を示している。
論文 参考訳(メタデータ) (2020-11-09T03:48:39Z) - Zero-Shot Multi-View Indoor Localization via Graph Location Networks [66.05980368549928]
屋内ローカライゼーションは、位置ベースアプリケーションにおける基本的な問題である。
本稿では,インフラストラクチャフリーで多視点画像に基づく屋内ローカライゼーションを実現するために,新しいニューラルネットワークアーキテクチャであるGraph Location Networks(GLN)を提案する。
GLNは、メッセージパッシングネットワークを通じて画像から抽出されたロバストな位置表現に基づいて位置予測を行う。
新たにゼロショット屋内ローカライズ設定を導入し,提案したGLNを専用ゼロショットバージョンに拡張することで,その課題に対処する。
論文 参考訳(メタデータ) (2020-08-06T07:36:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。