Fugu-MT 論文翻訳(概要): Learning to Anchor Visual Odometry: KAN-Based Pose Regression for Planetary Landing

論文の概要: Learning to Anchor Visual Odometry: KAN-Based Pose Regression for Planetary Landing

arxiv url: http://arxiv.org/abs/2602.06968v1
Date: Tue, 30 Dec 2025 12:28:07 GMT
ステータス: 翻訳完了
システム内更新日: 2026-02-23 12:01:13.498748
Title: Learning to Anchor Visual Odometry: KAN-Based Pose Regression for Planetary Landing
Title（参考訳）: アンカー・ビジュアル・オドメトリーの学習: 惑星着陸のためのカンベースポス・レグレッション
Authors: Xubo Luo, Zhaojin Li, Xue Wan, Wei Zhang, Leizheng Shu,
Abstract要約: KanLocは単眼の局所化フレームワークで、視覚計測と軽量だが頑丈な絶対的なポーズ回帰器を結合する。現実的な月面着陸データセットと実際の月面着陸データセットでは、平均翻訳誤差と回転誤差をそれぞれ32%と45%削減する。
参考スコア（独自算出の注目度）: 3.995977753693403
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Accurate and real-time 6-DoF localization is mission-critical for autonomous lunar landing, yet existing approaches remain limited: visual odometry (VO) drifts unboundedly, while map-based absolute localization fails in texture-sparse or low-light terrain. We introduce KANLoc, a monocular localization framework that tightly couples VO with a lightweight but robust absolute pose regressor. At its core is a Kolmogorov-Arnold Network (KAN) that learns the complex mapping from image features to map coordinates, producing sparse but highly reliable global pose anchors. These anchors are fused into a bundle adjustment framework, effectively canceling drift while retaining local motion precision. KANLoc delivers three key advances: (i) a KAN-based pose regressor that achieves high accuracy with remarkable parameter efficiency, (ii) a hybrid VO-absolute localization scheme that yields globally consistent real-time trajectories (>=15 FPS), and (iii) a tailored data augmentation strategy that improves robustness to sensor occlusion. On both realistic synthetic and real lunar landing datasets, KANLoc reduces average translation and rotation error by 32% and 45%, respectively, with per-trajectory gains of up to 45%/48%, outperforming strong baselines.
Abstract（参考訳）: 高精度でリアルタイムな6-DoFの局所化は、自律的な月面着陸にはミッションクリティカルであるが、既存のアプローチは限定的であり、ビジュアル・オドメトリー(VO)は無拘束でドリフトし、マップベースの絶対的な位置化はテクスチャ・スパースや低照度地形では失敗する。我々は,VOと軽量だが頑健な絶対的なポーズ回帰器を密結合する単分子局在化フレームワークkanLocを紹介する。中心となるのがKAN(Kolmogorov-Arnold Network)で、画像特徴から地図座標への複雑なマッピングを学習し、小さくて信頼性の高いグローバルなポーズアンカーを生成する。これらのアンカーはバンドル調整フレームワークに融合し、局所的な運動精度を維持しながらドリフトを効果的にキャンセルする。 KanLocは3つの重要な進歩を提供する。一特筆すべきパラメータ効率で高精度な感性ポーズ回帰器。 (ii)大域的に一貫したリアルタイム軌道(>=15 FPS)を出力するハイブリッドVO絶対局所化スキーム三センサ閉塞に対するロバスト性を向上させるための調整データ拡張戦略。現実的な月面着陸データセットと実際の月面着陸データセットでは、平均翻訳誤差と回転誤差をそれぞれ32%と45%削減し、軌道毎のゲインは45%/48%まで増加し、強いベースラインを上回っている。

関連論文リスト

RSGround-R1: Rethinking Remote Sensing Visual Grounding through Spatial Reasoning [61.84363374647606]
リモートセンシングビジュアルグラウンドディング(RSVG)は、自然言語記述に基づく大規模空中画像における対象物体のローカライズを目的としている。これらの記述はしばしば位置的手がかりに大きく依存しており、空間的推論においてMLLM(Multimodal Large Language Models)に固有の課題を提起している。空間理解の高度化を図るために,textbfRSGround-R1 と呼ばれる推論誘導型位置認識後学習フレームワークを提案する。
論文参考訳（メタデータ） (2026-01-29T12:35:57Z)
Reloc-VGGT: Visual Re-localization with Geometry Grounded Transformer [40.778996326009185]
初期核融合機構による多視点空間統合を行う最初のビジュアルローカライゼーションフレームワークを提案する。我々のフレームワークはVGGTのバックボーン上に構築されており、多視点3D形状を符号化している。本研究では,グローバルアテンションの2次複雑さを回避し,計算コストを削減する新しいスパースマスクアテンション戦略を提案する。
論文参考訳（メタデータ） (2025-12-26T06:12:17Z)
SVRecon: Sparse Voxel Rasterization for Surface Reconstruction [60.92372415355283]
我々は最近提案されたスパースボキセル化パラダイムをSVReconの統合により高忠実度表面再構成の課題に拡張する。本手法は, 常に高速な収束を保ちながら, 強い復元精度を実現する。
論文参考訳（メタデータ） (2025-11-21T16:32:01Z)
Loc$^2$: Interpretable Cross-View Localization via Depth-Lifted Local Feature Matching [80.57282092735991]
本稿では,高精度かつ解釈可能なクロスビューローカライズ手法を提案する。地上画像の3自由度(DoF)のポーズを、その局所的な特徴と基準空中画像とをマッチングすることによって推定する。実験では、クロスエリアテストや未知の向きといった挑戦的なシナリオにおいて、最先端の精度を示す。
論文参考訳（メタデータ） (2025-09-11T18:52:16Z)
Cross3DReg: Towards a Large-scale Real-world Cross-source Point Cloud Registration Benchmark [57.42211080221526]
異なるセンサーからのポイントクラウドデータを整列することを目的とした、クロスソースのポイントクラウド登録は、3Dビジョンの基本的なタスクである。ディープ登録モデルをトレーニングするための大規模な実世界のデータセットが公開されていないことや、複数のセンサーによってキャプチャされたポイントクラウド固有の違いが課題となっている。現在世界最大のマルチモーダル・クロスソース・クラウド登録データセットであるCross3DRegを構築している。クロスソース・ポイント・クラウド機能の整合性を高めるために,ビジュアル・ジオメトリ・アテンションガイド付きマッチングモジュールを提案する。
論文参考訳（メタデータ） (2025-09-08T09:01:13Z)
Bridging Simulation and Reality: A 3D Clustering-Based Deep Learning Model for UAV-Based RF Source Localization [0.0]
無人航空機(UAV)は、地上法よりもRFソースの局所化に大きな利点をもたらす。近年のディープラーニング(DL)の進歩は,特に屋外シナリオにおいて,局所化の精度をさらに高めた。本稿では、3Dクラスタリングに基づく特徴抽出をロバストなローカライゼーションに活用するDLベースの3DクラスタベースRealAdaptRNetを提案する。
論文参考訳（メタデータ） (2025-02-02T05:48:44Z)
GSplatLoc: Ultra-Precise Camera Localization via 3D Gaussian Splatting [0.0]
超精密ポーズ推定に3次元ガウススプラッティングの可変レンダリング機能を利用するカメラローカライズ手法であるGSplatLocを提案する。 GSplatLocは、高密度マッピングのローカライズのための新しいベンチマークを設定し、ロボット工学や拡張現実のような正確なリアルタイムローカライズを必要とするアプリケーションに重要な意味を持つ。
論文参考訳（メタデータ） (2024-12-28T07:14:14Z)
Disentangled Generation and Aggregation for Robust Radiance Fields [25.865597946144163]
三面体ベースの放射場は、高品質な表現と低コストな計算で、3Dシーンを効果的に切り離すことができる。しかし、トリプレーンの局所的な更新特性のため、前回のポーズ-NeRF最適化と同様の関節推定は局所的なミニマで容易に実現できる。本研究では,三面学習にグローバルな特徴コンテキストと滑らかさを導入するために,Distangled Triplane Generationモジュールを提案する。さらに,三葉機発電機による暗黙的制約を軽減するために,2段階のウォームスタートトレーニング戦略を導入する。
論文参考訳（メタデータ） (2024-09-24T04:01:26Z)
HGSLoc: 3DGS-based Heuristic Camera Pose Refinement [13.393035855468428]
HGSLocは、新しい軽量なプラグアンドプレイポーズ最適化フレームワークである。 3次元再構成と精細化戦略を統合して、より高いポーズ推定精度を実現する。提案手法は,NeRFを用いたニューラルローカライゼーション手法と比較して高い位置推定精度を示す。
論文参考訳（メタデータ） (2024-09-17T06:48:48Z)
AdaSfM: From Coarse Global to Fine Incremental Adaptive Structure from Motion [48.835456049755166]
AdaSfMは粗粒度適応型SfMアプローチであり、大規模かつ挑戦的なデータセットにスケーラブルである。当社のアプローチはまず,低コストセンサによる計測を利用して,ビューグラフの信頼性を向上させる,粗大なグローバルSfMを実現する。本手法では,全局所再構成をグローバルSfMの座標フレームに整合させるため,しきい値適応戦略を用いる。
論文参考訳（メタデータ） (2023-01-28T09:06:50Z)
Reconfigurable Voxels: A New Representation for LiDAR-Based Point Clouds [76.52448276587707]
本稿では,3次元点群から表現を構成する新しい手法であるReconfigurable Voxelsを提案する。具体的には,各地区を一定数のボクセルで適応的にカバーするランダムウォーク方式を考案する。この手法は,特に疎水領域において,ボクセル特性の安定性を効果的に向上することがわかった。
論文参考訳（メタデータ） (2020-04-06T15:07:16Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。