論文の概要: Global Structure-from-Motion Meets Feedforward Reconstruction
- arxiv url: http://arxiv.org/abs/2605.26103v2
- Date: Tue, 26 May 2026 06:05:29 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-27 17:51:41.182085
- Title: Global Structure-from-Motion Meets Feedforward Reconstruction
- Title(参考訳): Global Structure-from-Motion Meets Feedforward Reconstruction
- Authors: Linfei Pan, Johannes Schönberger, Marc Pollefeys,
- Abstract要約: Structure-from-Motionはコンピュータビジョンにおける中心的な課題である。
近年のフィードフォワード3次元再構成の進歩は,従来のSfM法における持続的故障の克服に大きく貢献している。
そこで我々は,古典的手法とフィードフォワード手法のそれぞれの長所を組み合わせることで,新しいStructure-from-Motionパイプラインを提案する。
- 参考スコア(独自算出の注目度): 50.69771349993019
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Structure-from-Motion -- the process of simultaneously estimating camera poses and 3D scene structure from a collection of images -- remains a central challenge in computer vision, with many open problems yet to be solved. Recent advances in feedforward 3D reconstruction have made significant strides in overcoming persistent failure cases of classical SfM methods, particularly in scenarios characterized by low texture, limited overlap, and symmetries. However, while feedforward approaches excel in these challenging conditions, they often face limitations regarding scalability, accuracy, or robustness, and typically fall short of classical methods in standard reconstruction settings. In this work, we systematically analyze these limitations and propose a new Structure-from-Motion pipeline by combining the respective strengths of classical and feedforward methods. Extensive experiments across multiple datasets show the benefits of our approach, achieving state-of-the-art results across a wide range of scenarios. We share our system as an open-source implementation at https://github.com/colmap/gluemap.
- Abstract(参考訳): 画像のコレクションからカメラポーズと3Dシーン構造を同時に推定するプロセスであるStructure-from-Motionは、コンピュータビジョンにおける中心的な課題であり、多くの未解決問題はまだ解決されていない。
フィードフォワード3次元再構成の最近の進歩は、特に低テクスチャ、限られた重複、対称性を特徴とするシナリオにおいて、古典的SfM法の持続的故障を克服するために大きな進歩を遂げている。
しかし、フィードフォワードアプローチはこれらの困難な条件で優れているが、スケーラビリティ、正確性、堅牢性に関する制限に直面し、通常、標準的な再構築設定では古典的な手法に欠ける。
本研究では,これらの制約を体系的に解析し,古典的手法とフィードフォワード手法のそれぞれの長所を組み合わせることで,新たな構造制御パイプラインを提案する。
複数のデータセットにわたる大規模な実験は、我々のアプローチの利点を示し、幅広いシナリオで最先端の結果を達成する。
当社のシステムはhttps://github.com/colmap/gluemap.comでオープンソース実装として公開しています。
関連論文リスト
- Long-Term Multi-Session 3D Reconstruction Under Substantial Appearance Change [52.46888249268445]
長期の環境モニタリングには、数ヶ月または数年ごとに分割された繰り返しサイト訪問で3Dモデルを再構築し調整する機能が必要である。
既存のアプローチは、独立して再構築されたセッションのポストホックアライメントに依存している。
我々は,共同SfM再建において,クロスセッション対応を直接実施することを提案する。
論文 参考訳(メタデータ) (2026-02-24T06:12:51Z) - 3D Reconstruction via Incremental Structure From Motion [1.4999444543328293]
本稿では,幾何推定の整合性およびバンドル調整による反復的改善の効果に着目し,逐次SfMパイプラインの詳細な実装について述べる。
その結果、視覚的に構造化された環境下でのスパース3次元再構成のための信頼性の高い方法として、インクリメンタルSfMの実用性をサポートした。
論文 参考訳(メタデータ) (2025-08-01T18:45:05Z) - Review of Feed-forward 3D Reconstruction: From DUSt3R to VGGT [10.984522161856955]
3D再構成は、拡張現実やバーチャルリアリティー、自動運転、ロボット工学など、多くの応用の基盤となる技術だ。
ディープラーニングは、3D再構築におけるパラダイムシフトを触媒している。
新しいモデルでは、統合されたディープネットワークを使用して、カメラのポーズと密集した幾何学を、1つの前方通過における非拘束画像から直接推測する。
論文 参考訳(メタデータ) (2025-07-11T09:41:54Z) - Occlusion-Aware Temporally Consistent Amodal Completion for 3D Human-Object Interaction Reconstruction [29.807994561746437]
本稿では,モノクロ映像から動的物体間相互作用を再構築するための新しい枠組みを提案する。
本手法は時間的コンテキストを統合し,ビデオシーケンス間のコヒーレンスを漸進的に洗練し,再構成を安定化させる。
難解な単眼ビデオに対する3Dガウススプラッティングによるアプローチの有効性を検証した。
論文 参考訳(メタデータ) (2025-07-10T19:56:10Z) - Intern-GS: Vision Model Guided Sparse-View 3D Gaussian Splatting [95.61137026932062]
Intern-GSはスパースビューガウススプラッティングのプロセスを強化する新しいアプローチである。
Intern-GSは多様なデータセットにまたがって最先端のレンダリング品質を実現する。
論文 参考訳(メタデータ) (2025-05-27T05:17:49Z) - Robust Incremental Structure-from-Motion with Hybrid Features [73.55745864762703]
本稿では,線とその構造的幾何学的関係を利用した漸進的構造移動システム(SfM)を提案する。
我々のシステムは、SfMの広く使われている点ベースの技術と比較すると、一貫して堅牢で正確である。
論文 参考訳(メタデータ) (2024-09-29T22:20:32Z) - MASt3R-SfM: a Fully-Integrated Solution for Unconstrained Structure-from-Motion [12.602510002753815]
我々は最近リリースされた3Dビジョンのための基礎モデルを構築し、局所的な3D再構成と正確なマッチングを堅牢に生成できる。
グローバル座標系における局所的再構成を正確に調整するための低メモリ方式を提案する。
私たちの新しいSfMパイプラインはシンプルで、スケーラブルで、高速で、本当に制約を受けていない。
論文 参考訳(メタデータ) (2024-09-27T21:29:58Z) - Distance Weighted Trans Network for Image Completion [52.318730994423106]
本稿では,DWT(Distance-based Weighted Transformer)を利用した画像コンポーネント間の関係をよりよく理解するためのアーキテクチャを提案する。
CNNは、粗い事前の局所的なテクスチャ情報を強化するために使用される。
DWTブロックは、特定の粗いテクスチャやコヒーレントな視覚構造を復元するために使用される。
論文 参考訳(メタデータ) (2023-10-11T12:46:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。