論文の概要: InstantSfM: Fully Sparse and Parallel Structure-from-Motion
- arxiv url: http://arxiv.org/abs/2510.13310v1
- Date: Wed, 15 Oct 2025 08:58:05 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-16 20:13:28.580564
- Title: InstantSfM: Fully Sparse and Parallel Structure-from-Motion
- Title(参考訳): InstantSfM:完全スパースと並列構造
- Authors: Jiankun Zhong, Zitong Zhan, Quankai Gao, Ziyu Chen, Haozhe Lou, Jiageng Mao, Ulrich Neumann, Yue Wang,
- Abstract要約: Structure-from-Motion (SfM) はカメラのポーズとシーンの形状を補正する手法である。
GLOMAPは、大規模なシナリオを扱う際に、CPUに固有のバンドル調整(BA)やグローバル位置決め(GP)を実装する。
本稿では,標準SfMパイプラインの各臨界ステージを高速化するために,GPU並列計算の潜在能力を最大限に活用する。
- 参考スコア(独自算出の注目度): 18.540622250926624
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Structure-from-Motion (SfM), a method that recovers camera poses and scene geometry from uncalibrated images, is a central component in robotic reconstruction and simulation. Despite the state-of-the-art performance of traditional SfM methods such as COLMAP and its follow-up work, GLOMAP, naive CPU-specialized implementations of bundle adjustment (BA) or global positioning (GP) introduce significant computational overhead when handling large-scale scenarios, leading to a trade-off between accuracy and speed in SfM. Moreover, the blessing of efficient C++-based implementations in COLMAP and GLOMAP comes with the curse of limited flexibility, as they lack support for various external optimization options. On the other hand, while deep learning based SfM pipelines like VGGSfM and VGGT enable feed-forward 3D reconstruction, they are unable to scale to thousands of input views at once as GPU memory consumption increases sharply as the number of input views grows. In this paper, we unleash the full potential of GPU parallel computation to accelerate each critical stage of the standard SfM pipeline. Building upon recent advances in sparse-aware bundle adjustment optimization, our design extends these techniques to accelerate both BA and GP within a unified global SfM framework. Through extensive experiments on datasets of varying scales (e.g. 5000 images where VGGSfM and VGGT run out of memory), our method demonstrates up to about 40 times speedup over COLMAP while achieving consistently comparable or even improved reconstruction accuracy. Our project page can be found at https://cre185.github.io/InstantSfM/.
- Abstract(参考訳): SfM(Structure-from-Motion)は、カメラのポーズやシーンの形状を未校正画像から復元する手法で、ロボットの再構築とシミュレーションの中心的なコンポーネントである。
COLMAPなどの従来のSfM手法の最先端性能にもかかわらず、GLOMAPはバンドル調整 (BA) やグローバル位置決め (GP) のCPU専用実装を導入し、大規模シナリオを扱う際の計算オーバーヘッドを大幅に増加させ、SfMの精度と速度のトレードオフをもたらす。
さらに、COLMAPとGLOMAPにおける効率的なC++ベースの実装の祝福には、さまざまな外部最適化オプションのサポートが欠如していることから、限られた柔軟性の呪いが伴う。
一方、VGGSfMやVGGTのようなディープラーニングベースのSfMパイプラインはフィードフォワード3D再構成を可能にするが、GPUメモリの消費が急激に増加するにつれて、一度に数千のインプットビューにスケールすることはできない。
本稿では,標準SfMパイプラインの各臨界ステージを高速化するために,GPU並列計算の潜在能力を最大限に活用する。
近年のスパース・アウェア・バンドル最適化の進歩に基づき,この手法を拡張し,統一グローバルSfMフレームワークにおけるBAとGPの高速化を実現した。
様々なスケールのデータセット(例えば、VGGSfMとVGGTがメモリを使い果たした5000画像)の広範な実験を通じて、我々の手法はCOLMAPよりも最大40倍のスピードアップを達成しつつ、一貫した比較や再構築精度の向上を実現している。
私たちのプロジェクトページはhttps://cre185.github.io/InstantSfM/で見ることができます。
関連論文リスト
- FastMap: Revisiting Structure from Motion through First-Order Optimization [26.930994695116198]
我々は,高速さと簡易さに焦点をあてた動き法から,新たなグローバルな構造であるFastMapを提案する。
我々は,FastMapがGPUアクセラレーションでCOLMAPやGLOMAPよりも最大10倍高速であり,ポーズ精度が同等であることを示す。
論文 参考訳(メタデータ) (2025-05-07T17:56:15Z) - A Constrained Optimization Approach for Gaussian Splatting from Coarsely-posed Images and Noisy Lidar Point Clouds [37.043012716944496]
カメラポーズ推定と3次元再構成を同時に行うための制約付き最適化手法を提案する。
実験により,提案手法は既存の(マルチモーダル)3DGSベースラインを著しく上回ることを示した。
論文 参考訳(メタデータ) (2025-04-12T08:34:43Z) - Light3R-SfM: Towards Feed-forward Structure-from-Motion [34.47706116389972]
Light3R-SfMは、大規模なStructure-from-Motionを効率的に構築するためのフィードフォワード、エンドツーエンドの学習可能なフレームワークである。
この研究は、データ駆動でフィードフォワードのSfMアプローチの先駆者であり、スケーラブルで正確で効率的な3D再構築への道を開いた。
論文 参考訳(メタデータ) (2025-01-24T20:46:04Z) - Robust Incremental Structure-from-Motion with Hybrid Features [73.55745864762703]
本稿では,線とその構造的幾何学的関係を利用した漸進的構造移動システム(SfM)を提案する。
我々のシステムは、SfMの広く使われている点ベースの技術と比較すると、一貫して堅牢で正確である。
論文 参考訳(メタデータ) (2024-09-29T22:20:32Z) - Global Structure-from-Motion Revisited [57.30100303979393]
我々は,グローバルSfMにおける技術状況より優れた新しい汎用システムとして,GLOMAPを提案する。
精度とロバスト性の観点からは、最も広く使われている増分SfMであるCOLMAPよりも高い結果が得られる。
当社のシステムはオープンソース実装として共有しています。
論文 参考訳(メタデータ) (2024-07-29T17:54:24Z) - Distributed Global Structure-from-Motion with a Deep Front-End [11.2064188838227]
我々は,グローバルSfMがSOTAインクリメンタルSfMアプローチ(COLMAP)と同等に機能するかどうかを検討する。
我々のSfMシステムは、分散計算を活用するためにゼロから設計されており、複数のマシン上で計算を並列化し、大規模なシーンにスケールすることができる。
論文 参考訳(メタデータ) (2023-11-30T18:47:18Z) - AdaSfM: From Coarse Global to Fine Incremental Adaptive Structure from
Motion [48.835456049755166]
AdaSfMは粗粒度適応型SfMアプローチであり、大規模かつ挑戦的なデータセットにスケーラブルである。
当社のアプローチはまず,低コストセンサによる計測を利用して,ビューグラフの信頼性を向上させる,粗大なグローバルSfMを実現する。
本手法では,全局所再構成をグローバルSfMの座標フレームに整合させるため,しきい値適応戦略を用いる。
論文 参考訳(メタデータ) (2023-01-28T09:06:50Z) - Image-specific Convolutional Kernel Modulation for Single Image
Super-resolution [85.09413241502209]
本稿では,新しい画像特異的畳み込み変調カーネル(IKM)を提案する。
我々は、画像や特徴のグローバルな文脈情報を利用して、畳み込みカーネルを適応的に調整するための注意重みを生成する。
単一画像超解像実験により,提案手法は最先端手法よりも優れた性能を示した。
論文 参考訳(メタデータ) (2021-11-16T11:05:10Z) - Image Matching across Wide Baselines: From Paper to Practice [80.9424750998559]
局所的な特徴とロバストな推定アルゴリズムの包括的なベンチマークを導入する。
パイプラインのモジュール構造は、さまざまなメソッドの容易な統合、構成、組み合わせを可能にします。
適切な設定で、古典的な解決策は依然として芸術の知覚された状態を上回る可能性があることを示す。
論文 参考訳(メタデータ) (2020-03-03T15:20:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。