論文の概要: Improved Bag-of-Words Image Retrieval with Geometric Constraints for Ground Texture Localization
- arxiv url: http://arxiv.org/abs/2505.11620v1
- Date: Fri, 16 May 2025 18:37:18 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-20 14:57:10.742544
- Title: Improved Bag-of-Words Image Retrieval with Geometric Constraints for Ground Texture Localization
- Title(参考訳): 地表面テクスチュアローカライゼーションのための幾何学的制約を用いた単語のバグ・オブ・ワード検索の改良
- Authors: Aaron Wilhelm, Nils Napp,
- Abstract要約: 下向きカメラを用いた地中テクスチャのローカライゼーションは、低コストで高精度なローカライゼーションソリューションを提供する。
地盤テクスチャローカライゼーションのためのBad-of-words (BoW)画像検索システムを改良した。
- 参考スコア(独自算出の注目度): 1.2430809884830318
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Ground texture localization using a downward-facing camera offers a low-cost, high-precision localization solution that is robust to dynamic environments and requires no environmental modification. We present a significantly improved bag-of-words (BoW) image retrieval system for ground texture localization, achieving substantially higher accuracy for global localization and higher precision and recall for loop closure detection in SLAM. Our approach leverages an approximate $k$-means (AKM) vocabulary with soft assignment, and exploits the consistent orientation and constant scale constraints inherent to ground texture localization. Identifying the different needs of global localization vs. loop closure detection for SLAM, we present both high-accuracy and high-speed versions of our algorithm. We test the effect of each of our proposed improvements through an ablation study and demonstrate our method's effectiveness for both global localization and loop closure detection. With numerous ground texture localization systems already using BoW, our method can readily replace other generic BoW systems in their pipeline and immediately improve their results.
- Abstract(参考訳): 下向きカメラを用いた地中テクスチャのローカライゼーションは、動的環境に対して堅牢で、環境修正を必要としない、低コストで高精度なローカライゼーションソリューションを提供する。
地盤テクスチャの局所化のためのBad-of-words(BoW)画像検索システムを改良し,グローバルな局所化の精度を大幅に向上し,SLAMにおけるループ閉鎖検出の精度向上とリコールを実現した。
提案手法は, ソフトな代入を伴う約$k$-means (AKM) ボキャブラリを利用して, 地盤テクスチャの局所化に固有の一貫した配向と一定スケールの制約を利用する。
SLAMのグローバルローカライゼーションとループクロージャ検出の異なるニーズを同定し,アルゴリズムの高精度かつ高速なバージョンを提示する。
提案手法の有効性をアブレーション実験により検証し,グローバルローカライゼーションとループ閉鎖検出の両方法の有効性を実証した。
BoWを用いた多くの地中テクスチャローカライズシステムでは,パイプライン内の他の汎用的なBoWシステムを簡単に置き換えることができ,その結果を即時改善することができる。
関連論文リスト
- Zooming In on Fakes: A Novel Dataset for Localized AI-Generated Image Detection with Forgery Amplification Approach [69.01456182499486]
textbfBR-Genは、さまざまなシーン認識アノテーションを備えた15万のローカル鍛造イメージの大規模なデータセットである。
textbfNFA-ViTはノイズ誘導フォージェリ増幅ビジョン変換器で、ローカライズされたフォージェリの検出を強化する。
論文 参考訳(メタデータ) (2025-04-16T09:57:23Z) - From Sparse to Dense: Camera Relocalization with Scene-Specific Detector from Feature Gaussian Splatting [5.731406209558667]
STDLocは完全な再ローカライゼーションパイプラインであり、前のポーズに頼ることなく正確な再ローカライゼーションを実現することができる。
STDLOCは、現在最先端のローカライゼーション手法よりも、ローカライゼーション精度とリコールの点で優れている。
論文 参考訳(メタデータ) (2025-03-25T05:18:19Z) - SparseFormer: Detecting Objects in HRW Shots via Sparse Vision Transformer [62.11796778482088]
本稿では,近接撮影とHRW撮影のオブジェクト検出のギャップを埋めるために,SparseFormerと呼ばれるモデル非依存のスパース視覚変換器を提案する。
提案されたSparseFormerは、オブジェクトを含む可能性のあるスパース分散ウィンドウを精査するために、注意トークンを選択的に使用する。
2つのHRWベンチマークであるPANDAとDOTA-v1.0の実験により、提案されたSparseFormerは、最先端のアプローチよりも検出精度(最大5.8%)と速度(最大3倍)を大幅に改善することを示した。
論文 参考訳(メタデータ) (2025-02-11T03:21:25Z) - HGSLoc: 3DGS-based Heuristic Camera Pose Refinement [13.393035855468428]
視覚的ローカライゼーションは、既知のシーン表現内のカメラのポーズと方向を決定するプロセスを指す。
本稿では,3次元再構成と改良戦略を統合したHGSLocを提案する。
提案手法は,NeRFベースのニューラルレンダリング手法と比較して,高速なレンダリング速度とローカライズ精度を示す。
論文 参考訳(メタデータ) (2024-09-17T06:48:48Z) - View Consistent Purification for Accurate Cross-View Localization [59.48131378244399]
本稿では,屋外ロボットのための微細な自己局在化手法を提案する。
提案手法は,既存のクロスビューローカライゼーション手法の限界に対処する。
これは、動的環境における知覚を増強する初めての疎視のみの手法である。
論文 参考訳(メタデータ) (2023-08-16T02:51:52Z) - AdaSfM: From Coarse Global to Fine Incremental Adaptive Structure from
Motion [48.835456049755166]
AdaSfMは粗粒度適応型SfMアプローチであり、大規模かつ挑戦的なデータセットにスケーラブルである。
当社のアプローチはまず,低コストセンサによる計測を利用して,ビューグラフの信頼性を向上させる,粗大なグローバルSfMを実現する。
本手法では,全局所再構成をグローバルSfMの座標フレームに整合させるため,しきい値適応戦略を用いる。
論文 参考訳(メタデータ) (2023-01-28T09:06:50Z) - RING++: Roto-translation Invariant Gram for Global Localization on a
Sparse Scan Map [20.276334172402763]
本稿では、位置認識のためのロト変換不変表現と、回転と翻訳の両方のグローバル収束を持つRing++を提案する。
理論的保証により、RING++はスパーススキャン付き軽量マップを使用して、大きな視点差に対処することができる。
これはスパーススキャンマップにおけるグローバルローカライゼーションのすべてのサブタスクに対処する初めての学習不要フレームワークである。
論文 参考訳(メタデータ) (2022-10-12T07:49:24Z) - Real-Time Scene Text Detection with Differentiable Binarization and
Adaptive Scale Fusion [62.269219152425556]
セグメンテーションに基づくシーンテキスト検出手法はシーンテキスト検出分野において大きな注目を集めている。
本稿では,二項化処理をセグメンテーションネットワークに統合する分散二項化(DB)モジュールを提案する。
アダプティブ・スケール・フュージョン (ASF) モジュールは, 異なるスケールの特徴を適応的に融合させることにより, スケールのロバスト性を向上させる。
論文 参考訳(メタデータ) (2022-02-21T15:30:14Z) - Probabilistic Visual Place Recognition for Hierarchical Localization [22.703331060822862]
視覚的位置認識に用いる画像検索手法をベイズ状態推定法に適応させる2つの手法を提案する。
本手法を用いて粗局在化ステージの局在化精度を大幅に向上させ、厳しい外観変化下における最新性能を保ちます。
論文 参考訳(メタデータ) (2021-05-07T07:39:14Z) - Features for Ground Texture Based Localization -- A Survey [12.160708336715489]
特徴量に基づく地盤テクスチャに基づく車両位置決めは,インフラストラクチャフリーな高精度な位置決めを実現する上で有望な手法である。
本研究は,画像ペアと合成変換を別々に行い,利用可能な特徴抽出手法を初めて広範囲に評価するものである。
我々は、AkaZE、SURF、CenSurEを最高のキーポイント検出器として同定し、CenSurEとORB、BRIEF、LATCHの特徴記述子をペアリングして、インクリメンタルなローカライゼーションで最大の成功率を達成する。
論文 参考訳(メタデータ) (2020-02-27T07:25:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。