論文の概要: AIM-SLAM: Dense Monocular SLAM via Adaptive and Informative Multi-View Keyframe Prioritization with Foundation Model
- arxiv url: http://arxiv.org/abs/2603.05097v2
- Date: Fri, 06 Mar 2026 14:11:46 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-23 08:17:41.934878
- Title: AIM-SLAM: Dense Monocular SLAM via Adaptive and Informative Multi-View Keyframe Prioritization with Foundation Model
- Title(参考訳): AIM-SLAM: ファンデーションモデルによる適応的およびインフォーマティブな多視点鍵フレーム優先順位付けによる単眼SLAM
- Authors: Jinwoo Jeon, Dong-Uk Seo, Eungchang Mason Lee, Hyun Myung,
- Abstract要約: AIM-SLAMは、適応的で情報的なマルチビュー優先順位付けを利用する、高密度な単分子SLAMフレームワークである。
我々は、選択したビュー間で一貫したアライメントを強制する共同マルチビューSim最適化を定式化する。
AIM-SLAMの有効性は実世界のデータセットで示され、ポーズ推定と密な再構成の両方において最先端の性能を達成する。
- 参考スコア(独自算出の注目度): 7.598885266145037
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recent advances in geometric foundation models have emerged as a promising alternative for addressing the challenge of dense reconstruction in monocular visual simultaneous localization and mapping (SLAM). Although geometric foundation models enable SLAM to leverage variable input views, the previous methods remain confined to two-view pairs or fixed-length inputs without sufficient deliberation of geometric context for view selection. To tackle this problem, we propose AIM-SLAM, a dense monocular SLAM framework that exploits an adaptive and informative multi-view keyframe prioritization with dense pointmap predictions from visual geometry grounded transformer (VGGT). Specifically, we introduce the selective information- and geometric-aware multi-view adaptation (SIGMA) module, which employs voxel overlap and information gain to retrieve a candidate set of keyframes and adaptively determine its size. Furthermore, we formulate a joint multi-view Sim(3) optimization that enforces consistent alignment across selected views, substantially improving pose estimation accuracy. The effectiveness of AIM-SLAM is demonstrated on real-world datasets, where it achieves state-of-the-art performance in both pose estimation and dense reconstruction. Our system supports ROS integration, with code is available at https://aimslam.github.io/.
- Abstract(参考訳): 幾何学的基礎モデルの最近の進歩は、単眼の視覚的同時局所化とマッピング(SLAM)における密な再構成の課題に対処するための、有望な代替手段として現れてきた。
幾何学的基礎モデルにより、SLAMは可変入力ビューを利用することができるが、以前の方法はビュー選択のための幾何学的文脈の十分な検討をすることなく、2ビューペアまたは固定長入力に限られる。
この問題に対処するために,視覚幾何学的基底変換器(VGGT)から高密度な点マップ予測を用いた適応的かつ情報的な多視点鍵フレーム優先順位付けを利用する,高密度単眼SLAMフレームワークであるAIM-SLAMを提案する。
具体的には、ボクセル重なりと情報ゲインを用いて鍵フレームの候補集合を検索し、そのサイズを適応的に決定する選択情報および幾何学的マルチビュー適応(SIGMA)モジュールを提案する。
さらに、選択されたビュー間で一貫したアライメントを強制し、ポーズ推定精度を大幅に向上する共同マルチビューSim(3)最適化を定式化する。
AIM-SLAMの有効性は実世界のデータセットで示され、ポーズ推定と密な再構成の両方において最先端の性能を達成する。
私たちのシステムはROS統合をサポートし、コードはhttps://aimslam.github.io/で利用可能です。
関連論文リスト
- FoundationSLAM: Unleashing the Power of Depth Foundation Models for End-to-End Dense Visual SLAM [50.9765003472032]
FoundationSLAMは、正確でロバストな追跡とマッピングのための学習ベースの単分子高密度SLAMシステムである。
我々の中核となる考え方は、基礎深度モデルからのガイダンスを活用することによって、推論によるフロー推定をブリッジすることである。
論文 参考訳(メタデータ) (2025-12-31T17:57:45Z) - MoRe: Monocular Geometry Refinement via Graph Optimization for Cross-View Consistency [48.18662506772122]
MoReは、クロスビューの整合性を改善し、スケールアライメントを実現するために設計された、トレーニング不要なモノクロ幾何リファインメント手法である。
我々は,MoReが3次元再構成を向上するだけでなく,特にスパース・ビュー・レンダリングのシナリオにおいて,新しいビュー合成を改善することを実証した。
論文 参考訳(メタデータ) (2025-10-08T15:11:32Z) - MASt3R-Fusion: Integrating Feed-Forward Visual Model with IMU, GNSS for High-Functionality SLAM [12.158063913401575]
フィードフォワード・ポイントマップ・レグレッションと相補的なセンサ情報を統合するマルチセンサ支援視覚SLAMフレームワークMASt3R-Fusionを提案する。
実時間スライディングウインドウ最適化とアグレッシブループ閉鎖を伴う大域的最適化の両立が可能な階層的因子グラフ設計法を開発した。
我々は、公開ベンチマークと自己収集データセットの両方に対するアプローチを評価し、精度とロバスト性を大幅に改善したことを示す。
論文 参考訳(メタデータ) (2025-09-25T05:26:28Z) - Relative Pose Estimation through Affine Corrections of Monocular Depth Priors [69.59216331861437]
本研究では,独立なアフィン(スケールとシフト)のあいまいさを明示的に考慮した相対ポーズ推定のための3つの解法を開発した。
提案する解法と古典的点ベース解法とエピポーラ制約を組み合わせたハイブリッド推定パイプラインを提案する。
論文 参考訳(メタデータ) (2025-01-09T18:58:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。