論文の概要: Keep It CALM: Toward Calibration-Free Kilometer-Level SLAM with Visual Geometry Foundation Models via an Assistant Eye
- arxiv url: http://arxiv.org/abs/2604.14795v1
- Date: Thu, 16 Apr 2026 08:58:57 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-17 21:29:31.816358
- Title: Keep It CALM: Toward Calibration-Free Kilometer-Level SLAM with Visual Geometry Foundation Models via an Assistant Eye
- Title(参考訳): 視覚幾何学基礎モデルによる校正不要キロメーターレベルSLAMに向けて
- Authors: Tianjun Zhang, Fengyi Zhang, Tianchen Deng, Lin Zhang, Hesheng Wang,
- Abstract要約: CAL2Mは任意のVGFMと互換性のあるプラグイン・アンド・プレイのフレームワークである。
一定の物理的間隔の先行を利用するためだけに「補助眼」を使用する。
不正確な内因論による回転と翻訳の誤りを効果的に正すことができる。
- 参考スコア(独自算出の注目度): 34.902300948471314
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Visual Geometry Foundation Models (VGFMs) demonstrate remarkable zero-shot capabilities in local reconstruction. However, deploying them for kilometer-level Simultaneous Localization and Mapping (SLAM) remains challenging. In such scenarios, current approaches mainly rely on linear transforms (e.g., Sim3 and SL4) for sub-map alignment, while we argue that a single linear transform is fundamentally insufficient to model the complex, non-linear geometric distortions inherent in VGFM outputs. Forcing such rigid alignment leads to the rapid accumulation of uncorrected residuals, eventually resulting in significant trajectory drift and map divergence. To address these limitations, we present CAL2M (Calibration-free Assistant-eye based Large-scale Localization and Mapping), a plug-and-play framework compatible with arbitrary VGFMs. Distinct from traditional systems, CAL2M introduces an "assistant eye" solely to leverage the prior of constant physical spacing, effectively eliminating scale ambiguity without any temporal or spatial pre-calibration. Furthermore, leveraging the assumption of accurate feature matching, we propose an epipolar-guided intrinsic and pose correction model. Supported by an online intrinsic search module, it can effectively rectify rotation and translation errors caused by inaccurate intrinsics through fundamental matrix decomposition. Finally, to ensure accurate mapping, we introduce a globally consistent mapping strategy based on anchor propagation. By constructing and fusing anchors across the trajectory, we establish a direct local-to-global mapping relationship. This enables the application of nonlinear transformations to elastically align sub-maps, effectively eliminating geometric misalignments and ensuring a globally consistent reconstruction. The source code of CAL2M will be publicly available at https://github.com/IRMVLab/CALM.
- Abstract(参考訳): Visual Geometry Foundation Models (VGFMs) は局所的な再構成において顕著なゼロショット機能を示す。
しかし、それらをキロレベルの同時局在マッピング(SLAM)にデプロイすることは依然として困難である。
このようなシナリオでは、現在のアプローチは主にサブマップアライメントのための線形変換(例えば、Sim3、SL4)に依存し、一方、単一の線形変換は、VGFM出力に固有の複雑で非線形な幾何学的歪みをモデル化するのに根本的に不十分であると主張する。
このような厳密なアライメントを強制すると、不正確な残留物が急速に蓄積され、最終的に軌道のドリフトと地図の発散が発生する。
これらの制約に対処するため、任意のVGFMと互換性のあるCAL2M(Calibration-free Assistant-eye based Large-scale Localization and Mapping)を提案する。
従来のシステムとは対照的に、CAL2Mは一定の物理的間隔の先行を有効活用するためだけに「補助眼」を導入し、時間的・空間的事前校正を伴わないスケールの曖昧さを効果的に排除した。
さらに, 特徴マッチングの精度を前提として, 固有・ポーズ補正モデルを提案する。
オンライン内在探索モジュールによって支援され、基本行列分解によって不正確な内在関係に起因する回転と翻訳の誤りを効果的に正すことができる。
最後に、正確なマッピングを保証するために、アンカーの伝搬に基づく一貫したマッピング戦略を導入する。
軌道を横断するアンカーの構築と融合により、直接局所-グローバルマッピング関係を確立する。
これにより、非線形変換を用いて部分写像を弾性的に整列させ、幾何学的不整合を効果的に排除し、大域的に一貫した再構成を保証することができる。
CAL2Mのソースコードはhttps://github.com/IRMVLab/CALMで公開されている。
関連論文リスト
- Sheaf-Laplacian Obstruction and Projection Hardness for Cross-Modal Compatibility on a Modality-Independent Site [0.0]
学習表現における相互互換を解析するための統一的なフレームワークを開発する。
有向モダリティ対 $(ato b)$ に対して、2つの相補的不和性機構を形式化する。
具体的なReLU設定では, 直接アライメントが不可能な場合でも, 中間モダリティは有効硬度を厳密に低減できることを示す。
論文 参考訳(メタデータ) (2026-04-08T22:20:25Z) - Neural network methods for two-dimensional finite-source reflector design [0.0]
本稿では,光を有限拡大源から所定の遠方界分布に変換する2次元反射体の設計の逆問題に対処する。
i) 学習した逆写像を通してソース分布をプッシュする直接変更変数損失と,(ii) ターゲット空間グリッドをソースにマップするメッシュベースの損失の2つの異なる目的関数を開発する。
論文 参考訳(メタデータ) (2026-04-02T15:45:50Z) - MirrorLA: Reflecting Feature Map for Vision Linear Attention [49.41670925034762]
リニアアテンションはトランスフォーマーの2次から線形への計算複雑性を著しく低下させるが、パフォーマンスにおけるソフトマックスに基づくアテンションの遅れは一貫して遅れる。
我々は、受動トランケーションをアクティブなリオリエンテーションに置き換える幾何学的枠組みであるMirrorLAを提案する。
MirrorLAは標準的なベンチマークで最先端のパフォーマンスを実現し、表現の忠実さを損なうことなく厳密な線形効率を実現できることを示した。
論文 参考訳(メタデータ) (2026-02-04T09:14:09Z) - Inverting Self-Organizing Maps: A Unified Activation-Based Framework [39.146761527401424]
我々は,SOMの活性化パターンを逆転させて,微妙な幾何学的条件下での正確な入力を復元できることを示す。
我々は,MUSIC (Manifold-Aware Unified SOM Inversion and Control) 更新ルールを導入する。
合成ガウス混合系, MNIST と Faces in the Wild を用いたアプローチを検証した。
論文 参考訳(メタデータ) (2026-01-20T11:02:54Z) - Non-Rigid Structure-from-Motion via Differential Geometry with Recoverable Conformal Scale [17.935227965480475]
共形変形下でのNRSfMに対するCon-NRSfMという新しい手法を提案する。
提案手法は,グラフベースのフレームワークにより最適化された2次元画像ワープを用いて,ポイントワイズ再構成を行う。
我々のフレームワークは、他のアプローチでは分離できない深さと等角スケールの制約を分離する。
論文 参考訳(メタデータ) (2025-10-02T04:46:46Z) - IDLS: Inverse Depth Line based Visual-Inertial SLAM [9.38589798999922]
Inverse Depth Line SLAM (IDLS) を提案する。
IDLSは、複数の知覚的整合性データセットで広く評価されている。
論文 参考訳(メタデータ) (2023-04-23T20:53:05Z) - Global-to-Local Modeling for Video-based 3D Human Pose and Shape
Estimation [53.04781510348416]
フレーム内精度とフレーム間スムーズさにより,映像に基づく3次元人間のポーズと形状推定を評価する。
エンドツーエンドフレームワークGLoT(Global-to-Local Transformer)における長期的・短期的相関のモデル化を構造的に分離することを提案する。
我々のGLoTは、一般的なベンチマーク(3DPW、MPI-INF-3DHP、Human3.6M)において、最も低いモデルパラメータを持つ従来の最先端の手法を上回る。
論文 参考訳(メタデータ) (2023-03-26T14:57:49Z) - Orthogonal Matrix Retrieval with Spatial Consensus for 3D Unknown-View
Tomography [58.60249163402822]
未知視トモグラフィ(UVT)は、未知のランダムな向きで2次元投影から3次元密度マップを再構成する。
提案したOMRはより堅牢で、従来の最先端のOMRアプローチよりも大幅に性能が向上している。
論文 参考訳(メタデータ) (2022-07-06T21:40:59Z) - Pushing the Envelope of Rotation Averaging for Visual SLAM [69.7375052440794]
視覚SLAMシステムのための新しい最適化バックボーンを提案する。
従来の単分子SLAMシステムの精度, 効率, 堅牢性を向上させるために, 平均化を活用している。
我々のアプローチは、公開ベンチマークの最先端技術に対して、同等の精度で最大10倍高速に表示することができる。
論文 参考訳(メタデータ) (2020-11-02T18:02:26Z) - Dense Non-Rigid Structure from Motion: A Manifold Viewpoint [162.88686222340962]
Non-Rigid Structure-from-Motion (NRSfM) 問題は、複数のフレームにまたがる2次元特徴対応から変形物体の3次元形状を復元することを目的としている。
提案手法は,ノイズに対する精度,スケーラビリティ,堅牢性を大幅に向上させる。
論文 参考訳(メタデータ) (2020-06-15T09:15:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。