論文の概要: Pole-centric Descriptors for Robust Robot Localization: Evaluation under Pole-at-Distance (PaD) Observations using the Small Pole Landmark (SPL) Dataset
- arxiv url: http://arxiv.org/abs/2512.23141v1
- Date: Mon, 29 Dec 2025 02:09:32 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-23 08:17:40.545099
- Title: Pole-centric Descriptors for Robust Robot Localization: Evaluation under Pole-at-Distance (PaD) Observations using the Small Pole Landmark (SPL) Dataset
- Title(参考訳): ロバストロボットローカライゼーションのためのポール中心記述子:小さなポールランドマーク(SPL)データセットを用いたポール・アット・ディスタンス(PaD)観測による評価
- Authors: Wuhao Xie, Kanji Tanaka,
- Abstract要約: 本稿では,記述子設計から記述子堅牢性に関する体系的な研究へと焦点を移す。
我々の主な貢献は、スモールポールランドマーク(SPL)データセットを中心とした、特別な評価フレームワークの確立である。
このフレームワークを用いて、コントラスト学習(CL)とスーパーバイザード学習(SL)のパラダイムの比較分析を行う。
- 参考スコア(独自算出の注目度): 0.7734726150561086
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: While pole-like structures are widely recognized as stable geometric anchors for long-term robot localization, their identification reliability degrades significantly under Pole-at-Distance (Pad) observations typical of large-scale urban environments. This paper shifts the focus from descriptor design to a systematic investigation of descriptor robustness. Our primary contribution is the establishment of a specialized evaluation framework centered on the Small Pole Landmark (SPL) dataset. This dataset is constructed via an automated tracking-based association pipeline that captures multi-view, multi-distance observations of the same physical landmarks without manual annotation. Using this framework, we present a comparative analysis of Contrastive Learning (CL) and Supervised Learning (SL) paradigms. Our findings reveal that CL induces a more robust feature space for sparse geometry, achieving superior retrieval performance particularly in the 5--10m range. This work provides an empirical foundation and a scalable methodology for evaluating landmark distinctiveness in challenging real-world scenarios.
- Abstract(参考訳): ポールのような構造は、長期ロボットの局所化のための安定な幾何アンカーとして広く認識されているが、その識別信頼性は大規模都市環境に典型的なポール・アット・ディスタンス(Pad)観測下で著しく低下する。
本稿では,記述子設計から記述子堅牢性に関する体系的な研究へと焦点を移す。
我々の主な貢献は、スモールポールランドマーク(SPL)データセットを中心とした、特別な評価フレームワークの確立である。
このデータセットは、自動トラッキングベースのアソシエーションパイプラインを使用して構築され、手動のアノテーションなしで同じ物理的なランドマークのマルチビュー、マルチ距離の観測をキャプチャする。
このフレームワークを用いて、コントラスト学習(CL)とスーパーバイザード学習(SL)のパラダイムの比較分析を行う。
以上の結果から, CLはスパース幾何学においてより堅牢な特徴空間を誘導し, 特に5~10mの範囲での検索性能に優れることがわかった。
この研究は実証的な基礎とスケーラブルな方法論を提供し、現実のシナリオに挑戦する際、目立った特異性を評価する。
関連論文リスト
- RSGround-R1: Rethinking Remote Sensing Visual Grounding through Spatial Reasoning [61.84363374647606]
リモートセンシングビジュアルグラウンドディング(RSVG)は、自然言語記述に基づく大規模空中画像における対象物体のローカライズを目的としている。
これらの記述はしばしば位置的手がかりに大きく依存しており、空間的推論においてMLLM(Multimodal Large Language Models)に固有の課題を提起している。
空間理解の高度化を図るために,textbfRSGround-R1 と呼ばれる推論誘導型位置認識後学習フレームワークを提案する。
論文 参考訳(メタデータ) (2026-01-29T12:35:57Z) - From Indoor to Open World: Revealing the Spatial Reasoning Gap in MLLMs [65.04549036809557]
我々は、ステレオカメラ、LiDAR、IMU/GPSセンサーで撮影された歩行者の視線映像から構築したベンチマークを紹介する。
このデータセットは、計量的に正確な3D情報を提供し、空間的推論質問の自動生成を可能にする。
評価の結果、構造化屋内ベンチマークで観測された性能向上は、オープンワールド環境では消滅することが明らかとなった。
論文 参考訳(メタデータ) (2025-12-22T18:58:12Z) - LC-SLab -- An Object-based Deep Learning Framework for Large-scale Land Cover Classification from Satellite Imagery and Sparse In-situ Labels [25.42215602005236]
本研究では,大規模土地被覆分類のためのオブジェクトベース深層学習手法をスパース監督下で探索するLC-SLabを提案する。
LC-SLabは、グラフニューラルネットワークによる入力レベルアグリゲーションと、後処理の結果による出力レベルアグリゲーションの両方をサポートする。
その結果、オブジェクトベースの手法は、よりコヒーレントなマップを生成しながら、一般的なピクセル単位のモデルの精度を一致または超えることができることがわかった。
論文 参考訳(メタデータ) (2025-09-19T11:08:24Z) - A Pseudo Global Fusion Paradigm-Based Cross-View Network for LiDAR-Based Place Recognition [12.93382945887946]
LiDARベースのPlace Recognition(LPR)は、Embodied Artificial Intelligence(AI)とAutonomous Drivingにおいて重要なタスクである。
既存のアプローチは、ユークリッド距離に基づく距離学習タスクへの位置認識を減らし、特徴空間の固有の構造やクラス内分散を無視している。
本稿では,これらの課題に対処する革新的な融合パラダイムに基づく,新しいクロスビューネットワークを提案する。
論文 参考訳(メタデータ) (2025-08-12T13:12:48Z) - GhostUMAP2: Measuring and Analyzing (r,d)-Stability of UMAP [7.70133333709347]
(r,d)-安定性は射影空間におけるデータポイントの位置を解析するフレームワークである。
ゴーストプロジェクションを効率的に計算するために,適応型ドロップ方式を開発した。
また,データポイントの(r,d)-安定性の相互探索を支援する可視化ツールを提案する。
論文 参考訳(メタデータ) (2025-07-23T03:40:53Z) - EarthMind: Leveraging Cross-Sensor Data for Advanced Earth Observation Interpretation with a Unified Multimodal LLM [103.7537991413311]
地球観測(EO)データ分析は、環境と人間の動態のモニタリングに不可欠である。
最近のMultimodal Large Language Models (MLLM) は、EO理解の可能性を秘めているが、シングルセンサー入力に限定されている。
我々は、シングルセンサーとクロスセンサーの両方の入力を処理する統合視覚言語フレームワークであるEarthMindを提案する。
論文 参考訳(メタデータ) (2025-06-02T13:36:05Z) - TopoFR: A Closer Look at Topology Alignment on Face Recognition [58.45515807380505]
PTSAと呼ばれるトポロジカル構造アライメント戦略とSDEという硬質試料マイニング戦略を利用する新しいFRモデルであるTopoFRを提案する。
PTSAは永続ホモロジーを用いて入力空間と潜在空間の位相構造を整列し、構造情報を効果的に保存し、FRモデルの一般化性能を向上させる。
一般的な顔のベンチマーク実験の結果は、最先端の手法よりもTopoFRの方が優れていることを示している。
論文 参考訳(メタデータ) (2024-10-14T14:58:30Z) - Monocular Per-Object Distance Estimation with Masked Object Modeling [33.59920084936913]
本稿では、Masked Image Modeling (MiM) からインスピレーションを得て、マルチオブジェクトタスクに拡張する。
Masked Object Modeling (MoM) と呼ばれる我々の戦略は、マスキング技術の新しい応用を可能にする。
我々は、標準KITTI、NuScenes、MOT Synthデータセット上の新しい参照アーキテクチャ(DistFormer)におけるMoMの有効性を評価する。
論文 参考訳(メタデータ) (2024-01-06T10:56:36Z) - Scope Head for Accurate Localization in Object Detection [135.9979405835606]
本研究では,各位置のアンカーを相互依存関係としてモデル化したScopeNetと呼ばれる新しい検出器を提案する。
我々の簡潔で効果的な設計により、提案したScopeNetはCOCOの最先端の成果を達成する。
論文 参考訳(メタデータ) (2020-05-11T04:00:09Z) - Topology Distance: A Topology-Based Approach For Evaluating Generative
Adversarial Networks [6.4029134551560345]
トポロジー距離 (TD) は、実データの潜在多様体の幾何学的特徴と位相的特徴を生成されたデータと比較する。
我々はTDと、その分野で最もよく使われている、関連する指標である、Inception Score(IS)、Frechet Inception Distance(FID)、Kernel Inception Distance(KID)、Geometry Score(GS)を比較した。
論文 参考訳(メタデータ) (2020-02-27T12:06:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。