論文の概要: G-MASt3R-SfM: Graph-based View Pruning and Multi-stage Optimization for Robust SfM
- arxiv url: http://arxiv.org/abs/2606.22856v1
- Date: Mon, 22 Jun 2026 05:01:08 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-25 04:07:09.601549
- Title: G-MASt3R-SfM: Graph-based View Pruning and Multi-stage Optimization for Robust SfM
- Title(参考訳): G-MASt3R-SfM:ロバストSfMのグラフベースビュープルーニングと多段最適化
- Authors: Toshiki Watanabe, Shintaro Ito, Natsuki Takama, Koichi Ito, Takafumi Aoki,
- Abstract要約: G-MASt3R-SfMは、2つの鍵モジュールによるロバスト性を高める新しいSfMパイプラインである。
まず、グラフベースのビュープルーニング(GVP)モジュールは、信頼度と幾何学的に不規則なビューとの整合性からシーングラフを構築する。
第二に、マルチステージ最適化(MSO)モジュールは、最適化範囲を局所的な一貫性からグローバルな一貫性へと拡張することで、カメラパラメータを段階的に洗練する。
- 参考スコア(独自算出の注目度): 1.3048920509133808
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Structure from Motion (SfM) is essential for multi-view 3D reconstruction, however, its accuracy heavily relies on the accuracy of image matching. While the recent correspondence matching method, MASt3R, enables robust matching even under challenging conditions, it tends to generate incorrect correspondences for non-overlapping image pairs. Consequently, existing SfM methods using MASt3R, such as MASt3R-SfM, suffer from significant degradation in pose estimation accuracy as they incorporate these unreliable matches directly into optimization. To address this issue, we propose G-MASt3R-SfM, a novel SfM pipeline that enhances robustness through two key modules. First, the Graph-based View Pruning (GVP) module constructs a scene graph from matching confidence and geometrically prunes outlier views. Second, the Multi-Stage Optimization (MSO) module progressively refines camera parameters by expanding the optimization scope from local consistency to the global consistency. Experiments on the ETH3D dataset demonstrate that our method achieves state-of-the-art accuracy in both camera pose estimation and 3D reconstruction, effectively suppressing noise caused by outliers.
- Abstract(参考訳): SfM(Structure from Motion)は多視点3次元再構成に必須であるが,精度は画像マッチングの精度に大きく依存している。
最近の対応マッチング手法であるMASt3Rは、困難な条件下でもロバストなマッチングを可能にするが、重複しない画像対に対して誤った対応を生成する傾向がある。
したがって、MASt3R-SfMのようなMASt3Rを用いた既存のSfM法は、これらの信頼できないマッチングを直接最適化するために、ポーズ推定精度が著しく低下する。
この問題に対処するため、G-MASt3R-SfMという、2つのキーモジュールによるロバスト性を高める新しいSfMパイプラインを提案する。
まず、グラフベースのビュープルーニング(GVP)モジュールは、信頼度と幾何学的に不規則なビューとの整合性からシーングラフを構築する。
第二に、マルチステージ最適化(MSO)モジュールは、最適化範囲を局所的な一貫性からグローバルな一貫性へと拡張することで、カメラパラメータを段階的に洗練する。
ETH3Dデータセットを用いた実験により, カメラポーズ推定と3次元再構成の両方において最先端の精度を実現し, 外れ値によるノイズを効果的に抑制できることを示した。
関連論文リスト
- M^3: Dense Matching Meets Multi-View Foundation Models for Monocular Gaussian Splatting SLAM [36.28718478194476]
M3はMulti-view基盤モデルを専用のMatchingヘッドで拡張し、細粒度の密度の高い通信を容易にする。
室内および屋外の様々なベンチマークの実験は、ポーズ推定とシーン再構成の両方において最先端の精度を示している。
論文 参考訳(メタデータ) (2026-03-17T17:52:37Z) - RobustSplat: Decoupling Densification and Dynamics for Transient-Free 3DGS [79.15416002879239]
3D Gaussian Splattingは、ノベルビュー合成と3Dモデリングにおけるリアルタイム、フォトリアリスティックレンダリングにおいて大きな注目を集めている。
既存の手法は、過渡的なオブジェクトに影響されたシーンを正確にモデル化するのに苦労し、描画された画像のアーティファクトに繋がる。
2つの重要な設計に基づく堅牢なソリューションであるRobustSplatを提案する。
論文 参考訳(メタデータ) (2025-06-03T11:13:48Z) - Dense-SfM: Structure from Motion with Dense Consistent Matching [10.24418219366936]
多視点画像からの高密度かつ高精度な3次元再構成のための新しいフレームワークであるDense-SfMを提案する。
Dense-SfMはGaussian Splatting (GS)ベースのトラック拡張と密マッチングを統合し、より一貫性があり、より長い機能トラックを提供する。
Dense-SfMは最先端の手法よりも精度と密度が大幅に向上した。
論文 参考訳(メタデータ) (2025-01-24T06:45:12Z) - PF3plat: Pose-Free Feed-Forward 3D Gaussian Splatting [54.7468067660037]
PF3platは、設計選択を検証した包括的なアブレーション研究によってサポートされた、すべてのベンチマークに新しい最先端を設定します。
本フレームワークは,3DGSの高速,スケーラビリティ,高品質な3D再構成とビュー合成機能を活用している。
論文 参考訳(メタデータ) (2024-10-29T15:28:15Z) - Correspondence-Guided SfM-Free 3D Gaussian Splatting for NVS [52.3215552448623]
SfM(Structure-from-Motion)事前処理カメラのポーズのない新しいビュー合成(NVS)は、迅速な応答能力の向上と、可変動作条件に対する堅牢性の向上に不可欠である。
最近のSfMフリー手法は、ポーズ最適化を統合し、共同カメラのポーズ推定とNVSのためのエンドツーエンドフレームワークを設計している。
既存の作業の多くは、L2損失のようなピクセル単位の画像損失関数に依存している。
本研究では,NVSのためのSfMフリー3次元ガウススプラッティングを提案する。
論文 参考訳(メタデータ) (2024-08-16T13:11:22Z) - DeepMLE: A Robust Deep Maximum Likelihood Estimator for Two-view
Structure from Motion [9.294501649791016]
動きからの2次元構造(SfM)は3次元再構成と視覚SLAM(vSLAM)の基礎となる。
本稿では,2視点SfM問題を最大最大推定(MLE)として定式化し,DeepMLEと表記されるフレームワークを用いて解いた。
提案手法は,最先端の2ビューSfM手法よりも精度と一般化能力において優れる。
論文 参考訳(メタデータ) (2022-10-11T15:07:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。