論文の概要: FastMap: Revisiting Dense and Scalable Structure from Motion
- arxiv url: http://arxiv.org/abs/2505.04612v2
- Date: Tue, 20 May 2025 03:10:38 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-21 19:22:16.863604
- Title: FastMap: Revisiting Dense and Scalable Structure from Motion
- Title(参考訳): FastMap: 動きからディッセンスとスケーラブルな構造を再考する
- Authors: Jiahao Li, Haochen Wang, Muhammad Zubair Irshad, Igor Vasiljevic, Matthew R. Walter, Vitor Campagnolo Guizilini, Greg Shakhnarovich,
- Abstract要約: 我々は,高速さと簡易さに焦点をあてた動き法から,新たなグローバルな構造であるFastMapを提案する。
COLMAPやGLOMAPといった従来の手法は、一致したキーポイントペアの数が大きくなるとスケーラビリティが低下する。
我々は,FastMapが大規模シーンにおけるCOLMAPやGLOMAPよりも高速で,ポーズ精度が同等であることを示す。
- 参考スコア(独自算出の注目度): 26.930994695116198
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We propose FastMap, a new global structure from motion method focused on speed and simplicity. Previous methods like COLMAP and GLOMAP are able to estimate high-precision camera poses, but suffer from poor scalability when the number of matched keypoint pairs becomes large. We identify two key factors leading to this problem: poor parallelization and computationally expensive optimization steps. To overcome these issues, we design an SfM framework that relies entirely on GPU-friendly operations, making it easily parallelizable. Moreover, each optimization step runs in time linear to the number of image pairs, independent of keypoint pairs or 3D points. Through extensive experiments, we show that FastMap is faster than COLMAP and GLOMAP on large-scale scenes with comparable pose accuracy.
- Abstract(参考訳): 我々は,高速さと簡易さに焦点をあてた動き法から,新たなグローバルな構造であるFastMapを提案する。
COLMAPやGLOMAPのような従来手法では、高精度カメラのポーズを推定できるが、一致したキーポイントペアの数が大きくなるとスケーラビリティが低下する。
この問題に繋がる2つの重要な要因は、並列化の貧弱さと計算コストのかかる最適化ステップである。
これらの問題を克服するために、GPUフレンドリな操作に完全に依存するSfMフレームワークを設計し、容易に並列化できるようにします。
さらに、各最適化ステップは、キーポイントペアや3Dポイントとは独立に、画像ペアの数に線形な時間で実行される。
広範にわたる実験により,FastMapは大規模シーンにおけるCOLMAPやGLOMAPよりも高速で,ポーズの精度が同等であることを示す。
関連論文リスト
- Revisiting FastMap: New Applications [9.754590060356119]
最初にFastMapを提示し、ほぼ直線時間でグラフのユークリッド埋め込みを生成する。
次に、FastMapのグラフバージョンを適用して、様々なグラフ理論問題を効率的に解決する。
また,FastMapとSupport Vector Machinesを組み合わせた新しい学習フレームワークFastMapSVMを提案する。
論文 参考訳(メタデータ) (2025-03-14T22:29:10Z) - RTMO: Towards High-Performance One-Stage Real-Time Multi-Person Pose Estimation [46.659592045271125]
RTMOは座標分類をシームレスに統合する一段階のポーズ推定フレームワークである。
高速を維持しながらトップダウン手法に匹敵する精度を達成する。
私たちの最大のモデルであるRTMO-lは、COCO val 2017で74.8%AP、1つのV100 GPUで141FPSを実現しています。
論文 参考訳(メタデータ) (2023-12-12T18:55:29Z) - TAPIR: Tracking Any Point with per-frame Initialization and temporal
Refinement [64.11385310305612]
本稿では,ビデオシーケンスを通して任意の物理面上の問合せ点を効果的に追跡する,TAP(Tracking Any Point)の新しいモデルを提案する。
提案手法では,(1)他のフレームの問合せ点に対する適切な候補点マッチングを独立に特定するマッチング段階と,(2)局所的相関に基づいてトラジェクトリと問合せの両方を更新する改良段階の2段階を用いる。
結果として得られたモデルは、DAVISにおける平均約20%の絶対平均ジャカード(AJ)改善によって示されるように、TAP-Vidベンチマークにおける大きなマージンで、すべてのベースライン手法を上回ります。
論文 参考訳(メタデータ) (2023-06-14T17:07:51Z) - FastMapSVM: Classifying Complex Objects Using the FastMap Algorithm and
Support-Vector Machines [12.728875331529345]
我々は、複雑なオブジェクトを分類する新しいフレームワークであるFastMapSVMを紹介する。
FastMapSVMは、FastMapとSupport-Map Machinesの強みを組み合わせたものだ。
FastMapSVMのパフォーマンスは他の最先端のメソッドと同等であることを示す。
論文 参考訳(メタデータ) (2022-04-07T18:01:16Z) - Multiway Non-rigid Point Cloud Registration via Learned Functional Map
Synchronization [105.14877281665011]
我々は、点雲上に定義された学習関数に関する地図を同期させることにより、複数の非剛体形状を登録する新しい方法であるSyNoRiMを提案する。
提案手法は,登録精度において最先端の性能を達成できることを実証する。
論文 参考訳(メタデータ) (2021-11-25T02:37:59Z) - ASH: A Modern Framework for Parallel Spatial Hashing in 3D Perception [91.24236600199542]
ASHは、GPU上の並列空間ハッシュのためのモダンで高性能なフレームワークである。
ASHはより高いパフォーマンスを実現し、よりリッチな機能をサポートし、より少ないコード行を必要とする。
ASHとそのサンプルアプリケーションはOpen3Dでオープンソース化されている。
論文 参考訳(メタデータ) (2021-10-01T16:25:40Z) - Generic Merging of Structure from Motion Maps with a Low Memory
Footprint [3.7838598767969502]
効率的で柔軟で堅牢なマップマージを可能にする新しいツールを紹介します。
シミュレーションデータと実データ – 手持ちの携帯電話とドローンの両方から – を用いることで,提案手法の性能を検証する。
論文 参考訳(メタデータ) (2021-03-24T15:03:25Z) - Displacement-Invariant Cost Computation for Efficient Stereo Matching [122.94051630000934]
ディープラーニング手法は、前例のない不一致の精度を得ることによって、ステレオマッチングのリーダーボードを支配してきた。
しかし、その推測時間は一般的に540p画像の秒数で遅い。
本研究では,4次元特徴量を必要としないEmphdisplacement-invariant cost moduleを提案する。
論文 参考訳(メタデータ) (2020-12-01T23:58:16Z) - FarSee-Net: Real-Time Semantic Segmentation by Efficient Multi-scale
Context Aggregation and Feature Space Super-resolution [14.226301825772174]
Cascaded Factorized Atrous Space Pyramid Pooling (CF-ASPP) と呼ばれる新しい効率的なモジュールについて紹介する。
これは畳み込みニューラルネットワーク(CNN)のための軽量なカスケード構造であり、コンテキスト情報を効率的に活用する。
我々は1枚のNivida Titan X (Maxwell) GPUカードでCityscapesテストセットの84fpsで68.4% mIoUを達成した。
論文 参考訳(メタデータ) (2020-03-09T03:53:57Z) - Voxel Map for Visual SLAM [57.07800982410967]
視覚SLAMのための点を効率的にマッピングするボクセルマップ表現を提案する。
本手法は,カメラの視野に落下することを幾何的に保証し,隠蔽点を特定・除去できる。
実験結果から,我々のボクセルマップ表現は5sの地図と同等に効率的であり,EuRoCデータセット上での局所化精度(平均46%の改善)が有意に高いことがわかった。
論文 参考訳(メタデータ) (2020-03-04T18:39:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。