論文の概要: VGGT-Motion: Motion-Aware Calibration-Free Monocular SLAM for Long-Range Consistency
- arxiv url: http://arxiv.org/abs/2602.05508v1
- Date: Thu, 05 Feb 2026 10:07:11 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-06 18:49:08.87767
- Title: VGGT-Motion: Motion-Aware Calibration-Free Monocular SLAM for Long-Range Consistency
- Title(参考訳): VGGT-Motion:ロングランジ一貫性のためのモーションアウェアキャリブレーションフリー単分子SLAM
- Authors: Zhuang Xiong, Chen Zhang, Qingshan Xu, Wenbing Tao,
- Abstract要約: VGGT-Motion(VGGT-Motion)は、キロスケールの軌道上での効率的なグローバル整合性のためのキャリブレーションフリーSLAMシステムである。
まず,光学フローを用いて適応分割を誘導する動き認識サブマップ構築機構を提案する。
次に、アンカー駆動のダイレクトSim(3)登録戦略を設計する。
実験により、VGGT-Motionは軌道の精度と効率を著しく改善することが示された。
- 参考スコア(独自算出の注目度): 28.71501560297241
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Despite recent progress in calibration-free monocular SLAM via 3D vision foundation models, scale drift remains severe on long sequences. Motion-agnostic partitioning breaks contextual coherence and causes zero-motion drift, while conventional geometric alignment is computationally expensive. To address these issues, we propose VGGT-Motion, a calibration-free SLAM system for efficient and robust global consistency over kilometer-scale trajectories. Specifically, we first propose a motion-aware submap construction mechanism that uses optical flow to guide adaptive partitioning, prune static redundancy, and encapsulate turns for stable local geometry. We then design an anchor-driven direct Sim(3) registration strategy. By exploiting context-balanced anchors, it achieves search-free, pixel-wise dense alignment and efficient loop closure without costly feature matching. Finally, a lightweight submap-level pose graph optimization enforces global consistency with linear complexity, enabling scalable long-range operation. Experiments show that VGGT-Motion markedly improves trajectory accuracy and efficiency, achieving state-of-the-art performance in zero-shot, long-range calibration-free monocular SLAM.
- Abstract(参考訳): 3次元視覚基礎モデルによるキャリブレーションフリー単分子SLAMの最近の進歩にもかかわらず、長周期でのスケールドリフトは厳しいままである。
動きに依存しない分割は文脈的コヒーレンスを破り、ゼロモーションドリフトを引き起こすが、従来の幾何学的アライメントは計算的に高価である。
これらの問題に対処するために、キロスケールの軌道上での効率よくロバストな大域的整合性を実現するキャリブレーションフリーSLAMシステムであるVGGT-Motionを提案する。
具体的には、まず、光学的フローを用いて、適応的分割、プルーン静的冗長性、および安定な局所幾何学のためのカプセル化を誘導する動き認識サブマップ構築機構を提案する。
次に、アンカー駆動のダイレクトSim(3)登録戦略を設計する。
コンテクストバランスの取れたアンカーを利用することで、検索不要でピクセルワイドなアライメントと効率的なループクロージャを実現する。
最後に、軽量なサブマップレベルのポーズグラフ最適化は、線形複雑性によるグローバルな一貫性を強制し、スケーラブルな長距離操作を可能にする。
実験により、VGGT-Motionは軌道精度と効率を著しく向上し、ゼロショット・長距離キャリブレーションフリー単分子SLAMにおける最先端性能を実現した。
関連論文リスト
- From Tokens to Nodes: Semantic-Guided Motion Control for Dynamic 3D Gaussian Splatting [26.57713792657793]
制御密度と動きの複雑さを一致させる動き適応フレームワークを提案する。
既存の最先端手法に比べて,復元品質と効率が大幅に向上したことを示す。
論文 参考訳(メタデータ) (2025-10-03T05:33:58Z) - WorldForge: Unlocking Emergent 3D/4D Generation in Video Diffusion Model via Training-Free Guidance [17.295532380360992]
WorldForgeは3つの密結合モジュールからなるトレーニング不要の推論時間フレームワークである。
我々のフレームワークはプラグアンドプレイとモデル非依存であり、様々な3D/4Dタスクに適用可能である。
論文 参考訳(メタデータ) (2025-09-18T16:40:47Z) - PMGS: Reconstruction of Projectile Motion across Large Spatiotemporal Spans via 3D Gaussian Splatting [9.314869696272297]
本研究では,3次元ガウス散乱によるプロジェクタイルの再構成に着目したPMGSを提案する。
本稿では,ニュートン力学を橋渡し,ポーズ推定を行う加速度制約を導入し,運動状態に基づいて学習率を適応的にスケジュールする動的シミュレート変形戦略を設計する。
論文 参考訳(メタデータ) (2025-08-04T17:49:37Z) - Motion Matters: Compact Gaussian Streaming for Free-Viewpoint Video Reconstruction [57.76758872762516]
3D Gaussian Splatting (3DGS)は、オンライン自由視点ビデオ(FVV)再構成のための高忠実で効率的なパラダイムとして登場した。
本研究では,動的シーンにおける動きの局所性と一貫性を活かした,コンパクトガウスストリーミング(ComGS)フレームワークを提案する。
ComGS は 3DGStream や 14X に比べて 159 X 以上のストレージ削減を実現している。
論文 参考訳(メタデータ) (2025-05-22T11:22:09Z) - DIMM: Decoupled Multi-hierarchy Kalman Filter for 3D Object Tracking [50.038098341549095]
状態推定は、高い操作性を持つ3次元物体追跡において困難である。
本稿では,各方向の異なる動きモデルから推定される推定を効果的に組み合わせる新しいフレームワークであるDIMMを提案する。
DIMMは既存の状態推定手法のトラッキング精度を31.61%99.23%向上させる。
論文 参考訳(メタデータ) (2025-05-18T10:12:41Z) - Steepest Descent Density Control for Compact 3D Gaussian Splatting [72.54055499344052]
3D Gaussian Splatting (3DGS)は、強力なリアルタイム高解像度ノベルビューとして登場した。
本稿では,3DGSの密度制御をデミストし,改良する理論的枠組みを提案する。
我々はSteepGSを導入し、コンパクトな点雲を維持しながら損失を最小限に抑える原則的戦略である、最も急な密度制御を取り入れた。
論文 参考訳(メタデータ) (2025-05-08T18:41:38Z) - Correspondence-Guided SfM-Free 3D Gaussian Splatting for NVS [52.3215552448623]
SfM(Structure-from-Motion)事前処理カメラのポーズのない新しいビュー合成(NVS)は、迅速な応答能力の向上と、可変動作条件に対する堅牢性の向上に不可欠である。
最近のSfMフリー手法は、ポーズ最適化を統合し、共同カメラのポーズ推定とNVSのためのエンドツーエンドフレームワークを設計している。
既存の作業の多くは、L2損失のようなピクセル単位の画像損失関数に依存している。
本研究では,NVSのためのSfMフリー3次元ガウススプラッティングを提案する。
論文 参考訳(メタデータ) (2024-08-16T13:11:22Z) - Improving Gaussian Splatting with Localized Points Management [52.009874685460694]
局所的点管理(LPM)は、点加算と幾何校正の両方を最大限に必要としながら、これらの誤り貢献ゾーンを特定することができる。
LPMは特定されたゾーンに点密度を適用し、これらの領域の前にある点の不透明度をリセットし、不適切な点を修正する新しい機会を生み出す。
特に、LPMは静的3DGSとダイナミックなSpaceTimeGSの両方を改善して、リアルタイム速度を維持しながら最先端のレンダリング品質を実現している。
論文 参考訳(メタデータ) (2024-06-06T16:55:07Z) - Improved Real-Time Monocular SLAM Using Semantic Segmentation on
Selective Frames [15.455647477995312]
先進的運転支援システムと自律運転システムでは単眼同時位置決めマッピング(slam)が登場している。
本稿では,深層学習に基づくセマンティックセグメンテーションを用いたリアルタイム一眼SLAMの改良を提案する。
6本の映像列を用いた実験により,提案方式により精度の高い軌道追尾精度が得られた。
論文 参考訳(メタデータ) (2021-04-30T22:34:45Z) - Pushing the Envelope of Rotation Averaging for Visual SLAM [69.7375052440794]
視覚SLAMシステムのための新しい最適化バックボーンを提案する。
従来の単分子SLAMシステムの精度, 効率, 堅牢性を向上させるために, 平均化を活用している。
我々のアプローチは、公開ベンチマークの最先端技術に対して、同等の精度で最大10倍高速に表示することができる。
論文 参考訳(メタデータ) (2020-11-02T18:02:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。