論文の概要: InterKey: Cross-modal Intersection Keypoints for Global Localization on OpenStreetMap
- arxiv url: http://arxiv.org/abs/2509.13857v2
- Date: Mon, 29 Sep 2025 04:12:09 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-30 17:47:09.233409
- Title: InterKey: Cross-modal Intersection Keypoints for Global Localization on OpenStreetMap
- Title(参考訳): InterKey: OpenStreetMap上のグローバルローカライゼーションのためのクロスプラットフォームインターセクションキーポイント
- Authors: Nguyen Hoang Khoi Tran, Julie Stephany Berrio, Mao Shan, Stewart Worrall,
- Abstract要約: OpenStreetMap (OSM)は、無償でグローバルに利用可能な代替手段を提供するが、その粗い抽象化は、センサーデータとマッチングする上での課題を提起する。
道路交差点をグローバルなローカライゼーションの目立ったランドマークとして活用するクロスモーダルなフレームワークであるInterKeyを提案する。
本手法は,道路を共同で符号化し,点群とOSMからのインプリントを構築することで,コンパクトなバイナリ記述子を構築する。
- 参考スコア(独自算出の注目度): 7.975038003192725
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Reliable global localization is critical for autonomous vehicles, especially in environments where GNSS is degraded or unavailable, such as urban canyons and tunnels. Although high-definition (HD) maps provide accurate priors, the cost of data collection, map construction, and maintenance limits scalability. OpenStreetMap (OSM) offers a free and globally available alternative, but its coarse abstraction poses challenges for matching with sensor data. We propose InterKey, a cross-modal framework that leverages road intersections as distinctive landmarks for global localization. Our method constructs compact binary descriptors by jointly encoding road and building imprints from point clouds and OSM. To bridge modality gaps, we introduce discrepancy mitigation, orientation determination, and area-equalized sampling strategies, enabling robust cross-modal matching. Experiments on the KITTI dataset demonstrate that InterKey achieves state-of-the-art accuracy, outperforming recent baselines by a large margin. The framework generalizes to sensors that can produce dense structural point clouds, offering a scalable and cost-effective solution for robust vehicle localization.
- Abstract(参考訳): 信頼性の高いグローバルなローカライゼーションは、特に都市キャニオンやトンネルなど、GNSSが劣化または利用できない環境では、自動運転車にとって重要である。
高精細(HD)マップは正確な事前情報を提供するが、データ収集、マップ構築、メンテナンスのコストはスケーラビリティを制限している。
OpenStreetMap (OSM)は、無償でグローバルに利用可能な代替手段を提供するが、その粗い抽象化は、センサーデータとマッチングする上での課題を提起する。
道路交差点をグローバルなローカライゼーションの目立ったランドマークとして活用するクロスモーダルなフレームワークであるInterKeyを提案する。
本手法は,道路を共同で符号化し,点群とOSMからのインプリントを構築することで,コンパクトなバイナリ記述子を構築する。
モダリティギャップを橋渡しするために, 離散性緩和, 方向決定, 領域等化サンプリング戦略を導入し, 堅牢なクロスモーダルマッチングを実現する。
KITTIデータセットの実験では、InterKeyが最先端の精度を達成し、最近のベースラインを大きなマージンで上回っていることが示されている。
このフレームワークは、高密度な構造点雲を生成できるセンサーに一般化され、堅牢な車両ローカライゼーションのためのスケーラブルで費用対効果の高いソリューションを提供する。
関連論文リスト
- InterLoc: LiDAR-based Intersection Localization using Road Segmentation with Automated Evaluation Method [10.561470037080177]
オンライン車両中心の交差点位置決めのための新しいLiDAR方式を提案する。
我々は,鳥の視線(BEV)表現における交叉候補を,意味的道路スキャンを連結して検出する。
セマンティックKITTITIデータセットの実験から,本手法は最新の学習ベースラインよりも精度と信頼性が優れていることが示された。
論文 参考訳(メタデータ) (2025-05-01T13:30:28Z) - SegLocNet: Multimodal Localization Network for Autonomous Driving via Bird's-Eye-View Segmentation [0.0]
SegLocNetはセマンティックセグメンテーションを用いて正確なローカライゼーションを実現するマルチモーダルフリーなローカライゼーションネットワークである。
本手法は,都市環境におけるエゴポーズを,一般化に頼ることなく正確に推定することができる。
私たちのコードと事前訓練されたモデルは公開されます。
論文 参考訳(メタデータ) (2025-02-27T13:34:55Z) - PFSD: A Multi-Modal Pedestrian-Focus Scene Dataset for Rich Tasks in Semi-Structured Environments [73.80718037070773]
本稿では, 半構造化シーンに, nuScenesの形式を付加したマルチモーダルなPedestrian-Focused Sceneデータセットを提案する。
また,密集・隠蔽シナリオにおける歩行者検出のためのHMFN(Hybrid Multi-Scale Fusion Network)を提案する。
論文 参考訳(メタデータ) (2025-02-21T09:57:53Z) - TrafficLoc: Localizing Traffic Surveillance Cameras in 3D Scenes [49.43995864524434]
本稿では,画像間クラウド登録(I2P)手法であるTrafficLocを提案する。
大規模な現実世界の交差点データセットの欠如を克服するため、カルラの75の都市と農村の交差点を持つ新しいシミュレーションデータセットであるCarla Intersectionを紹介した。
我々のTrafficLocは、Carla Intersection上でSOTA I2P法(最大86%)よりも大幅に性能を向上し、実世界のデータに対してよく一般化する。
論文 参考訳(メタデータ) (2024-12-13T17:42:53Z) - SF-Loc: A Visual Mapping and Geo-Localization System based on Sparse Visual Structure Frames [3.5047603107971397]
SF-Locは軽量なビジュアルマッピングとマップ支援型ローカライゼーションシステムである。
マッピングフェーズでは,多センサ高密度バンドル調整(MS-DBA)を適用し,ジオレファレンスな視覚構造フレームを構築する。
ローカライズフェーズでは、多フレーム情報と地図分布を完全に統合した粗大な視覚に基づくローカライズを行う。
論文 参考訳(メタデータ) (2024-12-02T13:51:58Z) - Semi-supervised Domain Adaptive Structure Learning [72.01544419893628]
半教師付きドメイン適応 (SSDA) は,1) アノテーションの低いデータに過度に適合する手法と,2) ドメイン間の分散シフトの両方を克服しなければならない課題である。
SSLとDAの協調を正規化するための適応型構造学習手法を提案する。
論文 参考訳(メタデータ) (2021-12-12T06:11:16Z) - Focus on Local: Detecting Lane Marker from Bottom Up via Key Point [10.617793053931964]
本研究では,局所パターンのモデル化とグローバルな構造予測に焦点をあてた新しいレーンマーカー検出ソリューションFOLOLaneを提案する。
具体的には、CNNは2つの異なる頭部を持つ低複雑局所パターンをモデル化し、第1は鍵点の存在を予測し、第2は局所範囲における鍵点の位置を洗練し、同じレーン線の鍵点を相関させる。
論文 参考訳(メタデータ) (2021-05-28T08:59:14Z) - Zero-Shot Multi-View Indoor Localization via Graph Location Networks [66.05980368549928]
屋内ローカライゼーションは、位置ベースアプリケーションにおける基本的な問題である。
本稿では,インフラストラクチャフリーで多視点画像に基づく屋内ローカライゼーションを実現するために,新しいニューラルネットワークアーキテクチャであるGraph Location Networks(GLN)を提案する。
GLNは、メッセージパッシングネットワークを通じて画像から抽出されたロバストな位置表現に基づいて位置予測を行う。
新たにゼロショット屋内ローカライズ設定を導入し,提案したGLNを専用ゼロショットバージョンに拡張することで,その課題に対処する。
論文 参考訳(メタデータ) (2020-08-06T07:36:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。