論文の概要: Globally Localizing Lunar Rover in Pixels via Graph Alignment
- arxiv url: http://arxiv.org/abs/2606.10602v1
- Date: Tue, 09 Jun 2026 09:04:54 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-10 15:40:58.409157
- Title: Globally Localizing Lunar Rover in Pixels via Graph Alignment
- Title(参考訳): グラフアライメントによる画素の月面ローバーのグローバル局在化
- Authors: Mao Chen, Xu Yang, Chuankai Liu, Xiangkai Zhang, Xiaoxue Wang, Zheng Bo, Zuoyu Zhang, Zhiyong Liu,
- Abstract要約: クロスビューローカライゼーションは、ローバービューと衛星ビューの画像とをマッチングすることにより、ドリフトフリーなグローバルソリューションを提供する。
統合グラフ学習と再計画グラフマッチングを併用し、堅牢なクロスビューアライメントを実現するフレームワークであるウォープアライメント・オブ・リジェンドグラフ(WARG)を提案する。
- 参考スコア(独自算出の注目度): 8.734737017643416
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Precise rover localization is a prerequisite for autonomous lunar exploration, yet the absence of Global Navigation Satellite System (GNSS) signals and the cumulative drift of local localization methods severely constrain long-range missions. Cross-view localization provides a promising drift-free global solution by matching rover-view and satellite-view imagery. However, the lunar environment poses unique challenges for correspondence alignment, including inter-entity entanglement, inter-viewpoint divergence, and simulation-to-real domain shift. To address these challenges, we propose Warped Alignment of Reprojected Graphs (WARG), a framework that leverages unified graph learning and reprojected graph matching for robust cross-view alignment. Pretrained on the synthetic LuSNAR dataset, WARG achieves an average test error of 0.32 m and demonstrates robust zero-shot generalization to the synthetic lunar south pole region with an error of 3.63 m. More importantly, when validated on real-world data from the YuTu-2 rover, WARG achieves a localization error of 1.68 m within a 100 m x 100 m search area, corresponding to nearly one-pixel precision in low-resolution satellite imagery with a spatial resolution of 1.40 m/pixel. Beyond accuracy, WARG is computationally efficient, containing only 1.56M parameters, corresponding to 16.12% of previous lightweight models, and operating at 5.49 Hz on an NVIDIA RTX A6000 GPU, approaching GNSS-level update frequency. Finally, we observe that WARG naturally develops low-level spatial awareness, including semantic segmentation and structural reasoning, through cross-view localization learning, highlighting its potential as a promising paradigm for spatial intelligence with minimal annotation cost. The source code is available at https://github.com/maochen-casia/warg.
- Abstract(参考訳): 精密なローバーの局地化は自律的な月探査の必須条件であるが、GNSS(Global Navigation Satellite System)信号の欠如と、局所的な局地化手法の累積ドリフトが長距離ミッションを厳しく制限している。
クロスビューローカライゼーションは、ローバービューと衛星ビューの画像とを一致させることで、有望なドリフトフリーなグローバルソリューションを提供する。
しかし、月面環境は、エンタリティ間の絡み合い、視点間のばらつき、シミュレーションから現実へのドメインシフトなど、アライメントアライメントに固有の課題を生んでいる。
これらの課題に対処するために、統合グラフ学習と再計画グラフマッチングを活用して、堅牢なクロスビューアライメントを実現するフレームワークであるウォープアライメント・オブ・リジェンドグラフ(WARG)を提案する。
合成LuSNARデータセットで事前訓練されたWARGは平均試験誤差0.32mを達成し、3.63mの誤差で合成月の南極地域への堅牢なゼロショットの一般化を示す。
さらに重要なことは、YuTu-2のローバーからの実世界データで検証された場合、WARGは100m×100mの探索領域内で1.68mの局所誤差を達成し、空間解像度が1.40m/ピクセルの低解像度衛星画像のほぼ1ピクセル精度に対応する。
WARGは計算効率が良く、従来の軽量モデルの16.12%に相当する1.56Mパラメータのみを含み、NVIDIA RTX A6000 GPU上で5.49Hzで動作し、GNSSレベルの更新周波数に接近する。
最後に,WARGが意味的セグメンテーションや構造的推論などの低レベルの空間認識を,クロスビューなローカライゼーション学習を通じて自然に発展させ,その可能性を最小限のアノテーションコストで空間知能に期待できるパラダイムとして強調する。
ソースコードはhttps://github.com/maochen-casia/warg.comで公開されている。
関連論文リスト
- Meridian: Metric-Semantic Primitive Matching for Cross-View Geo-Localization Beyond Urban Environments [47.53030013880309]
ロボット自動化の成功には、リピータビリティ、タスク計画、目標仕様、安全な操作をサポートするために、正確なグローバルローカライゼーションが必要である。
本稿では,空中画像と地上ロボットRGB-Dカメラデータにまたがって,ハイレベルなメトリック・セマンティックプリミティブをマッチングする方法であるメリディアンを提案する。
我々のアルゴリズムは、自律運転データセット、公園とキャンパスのエリア、荒野キャンプなど、幅広い環境にまたがる地上ロボットをローカライズできることを実証する。
論文 参考訳(メタデータ) (2026-06-04T15:52:40Z) - Are VLMs Lost Between Sky and Space? LinkS$^2$Bench for UAV-Satellite Dynamic Cross-View Spatial Intelligence [107.79496500634691]
LinkS$2$Benchは、ダイナミックUAV映像の1,022分を200km$2$の高解像度衛星画像とリンクする。
LMMを用いたパイプラインと厳密な人間のアノテーションを用いて17.9kの高品質な質問応答ペアを構築した。
評価は、人間のベースラインとはかなりの差を示し、正確なクロスビューのダイナミックアライメントを重要なボトルネックと特定する。
論文 参考訳(メタデータ) (2026-04-02T13:22:57Z) - Just Zoom In: Cross-View Geo-Localization via Autoregressive Zooming [4.396860522241306]
クロスビュージオローカライゼーションは、ストリートビュー画像とジオレファレンスされたオーバーヘッド画像とをマッチングすることにより、カメラの位置を推定する。
既存の手法は、対照的に訓練された埋め込み空間における画像検索問題としてCVGLをほぼ普遍的に定式化する。
都市規模のオーバヘッドマップ上でオートレズームによりCVGLを実行する代替式であるJust Zoom Inを提案する。
論文 参考訳(メタデータ) (2026-03-26T17:36:33Z) - LunarLoc: Segment-Based Global Localization on the Moon [52.418394025548295]
GPSのような従来の地球ベースのナビゲーションインフラが利用できない月面での自律的な運用には、グローバルなローカライゼーションが不可欠である。
本稿では,グローバルなローカライゼーション手法であるLunarLocを提案する。
LunarLocは、マルチセッショングローバルローカライゼーション実験において、サブcmレベルの精度を実現し、月のグローバルローカライゼーションにおける技術状況を大幅に上回っている。
論文 参考訳(メタデータ) (2025-06-20T12:06:47Z) - EarthMapper: Visual Autoregressive Models for Controllable Bidirectional Satellite-Map Translation [50.433911327489554]
制御可能な衛星マップ翻訳のための新しいフレームワークであるEarthMapperを紹介する。
また,中国38都市を対象とした302,132組の衛星マップからなる大規模データセットであるCNSatMapをコントリビュートした。
CNSatMapとNew Yorkデータセットの実験は、EarthMapperの優れたパフォーマンスを実証している。
論文 参考訳(メタデータ) (2025-04-28T02:41:12Z) - STRMs: Spatial Temporal Reasoning Models for Vision-Based Localization Rivaling GPS Precision [3.671692919685993]
VAE-RNNとVAE-Transformerという2つの逐次生成モデルを導入し,一対一の視点観察をグローバルマップの視点表現に変換する。
我々は、ジャカルロボットによってナビゲートされた大学キャンパスと、Teslaセダンによってナビゲートされた都市中心街の2つの現実世界環境において、これらのモデルを評価した。
論文 参考訳(メタデータ) (2025-03-11T00:38:54Z) - Boosting 3-DoF Ground-to-Satellite Camera Localization Accuracy via
Geometry-Guided Cross-View Transformer [66.82008165644892]
地上レベルの画像と一致/検索衛星画像との相対的な回転と変換を推定することにより、地上カメラの位置と方向の精度を向上させる手法を提案する。
実験の結果,本手法は最先端の手法よりも優れていた。
論文 参考訳(メタデータ) (2023-07-16T11:52:27Z) - Visual Cross-View Metric Localization with Dense Uncertainty Estimates [11.76638109321532]
本研究は、屋外ロボティクスにおける視覚的クロスビューメトリックローカライゼーションに対処する。
地上レベルのカラー画像と局地的な環境を含む衛星パッチが与えられた場合、衛星パッチ内の地上カメラの位置を特定することが課題である。
我々は、より高密度な衛星記述子、ボトルネックにおける類似性マッチング、およびマルチモーダルなローカライゼーションの曖昧さを捉えるための出力としての密度空間分布を備えた新しいネットワークアーキテクチャを考案した。
論文 参考訳(メタデータ) (2022-08-17T20:12:23Z) - Beyond Cross-view Image Retrieval: Highly Accurate Vehicle Localization
Using Satellite Image [91.29546868637911]
本稿では,地上画像と架空衛星地図とをマッチングすることにより,車載カメラのローカライゼーションの問題に対処する。
鍵となる考え方は、タスクをポーズ推定として定式化し、ニューラルネットベースの最適化によってそれを解くことである。
標準自動運転車のローカライゼーションデータセットの実験により,提案手法の優位性が確認された。
論文 参考訳(メタデータ) (2022-04-10T19:16:58Z) - City-wide Street-to-Satellite Image Geolocalization of a Mobile Ground
Agent [38.140216125792755]
クロスビュー画像のジオローカライゼーションは、GPSを必要とせずに、局地画像とオーバーヘッド衛星画像とをマッチングすることにより、エージェントのグローバルな位置を推定する。
我々のアプローチはワイド・エリア・ジオローカライゼーション (WAG) と呼ばれ、ニューラルネットワークと粒子フィルタを組み合わせることで、GPSを付加した環境で移動するエージェントのグローバルな位置推定を実現している。
WAGは、20mの順序で位置推定精度を達成し、ベースライントレーニングと重み付けのアプローチと比較して98%の削減を実現した。
論文 参考訳(メタデータ) (2022-03-10T19:54:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。