論文の概要: FastMap: Revisiting Structure from Motion through First-Order Optimization
- arxiv url: http://arxiv.org/abs/2505.04612v3
- Date: Thu, 21 Aug 2025 01:12:14 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-22 14:03:17.134243
- Title: FastMap: Revisiting Structure from Motion through First-Order Optimization
- Title(参考訳): FastMap: ファーストオーダーの最適化を通じて、モーションから構造を再考する
- Authors: Jiahao Li, Haochen Wang, Muhammad Zubair Irshad, Igor Vasiljevic, Matthew R. Walter, Vitor Campagnolo Guizilini, Greg Shakhnarovich,
- Abstract要約: 我々は,高速さと簡易さに焦点をあてた動き法から,新たなグローバルな構造であるFastMapを提案する。
我々は,FastMapがGPUアクセラレーションでCOLMAPやGLOMAPよりも最大10倍高速であり,ポーズ精度が同等であることを示す。
- 参考スコア(独自算出の注目度): 26.930994695116198
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We propose FastMap, a new global structure from motion method focused on speed and simplicity. Previous methods like COLMAP and GLOMAP are able to estimate high-precision camera poses, but suffer from poor scalability when the number of matched keypoint pairs becomes large, mainly due to the time-consuming process of second-order Gauss-Newton optimization. Instead, we design our method solely based on first-order optimizers. To obtain maximal speedup, we identify and eliminate two key performance bottlenecks: computational complexity and the kernel implementation of each optimization step. Through extensive experiments, we show that FastMap is up to 10 times faster than COLMAP and GLOMAP with GPU acceleration and achieves comparable pose accuracy.
- Abstract(参考訳): 我々は,高速さと簡易さに焦点をあてた動き法から,新たなグローバルな構造であるFastMapを提案する。
COLMAPやGLOMAPのような従来の手法では、高精度カメラのポーズを推定できるが、一致したキーポイントペアの数が大きくなるとスケーラビリティが低下する。
代わりに、1次オプティマイザのみに基づく手法を設計する。
最大高速化のために,計算複雑性と最適化ステップのカーネル実装の2つの主要な性能ボトルネックを特定し,排除する。
実験により,FastMapはGPUアクセラレーションによるCOLMAPやGLOMAPよりも最大10倍高速で,ポーズ精度が同等であることが確認された。
関連論文リスト
- Revisiting FastMap: New Applications [9.754590060356119]
最初にFastMapを提示し、ほぼ直線時間でグラフのユークリッド埋め込みを生成する。
次に、FastMapのグラフバージョンを適用して、様々なグラフ理論問題を効率的に解決する。
また,FastMapとSupport Vector Machinesを組み合わせた新しい学習フレームワークFastMapSVMを提案する。
論文 参考訳(メタデータ) (2025-03-14T22:29:10Z) - RTMO: Towards High-Performance One-Stage Real-Time Multi-Person Pose Estimation [46.659592045271125]
RTMOは座標分類をシームレスに統合する一段階のポーズ推定フレームワークである。
高速を維持しながらトップダウン手法に匹敵する精度を達成する。
私たちの最大のモデルであるRTMO-lは、COCO val 2017で74.8%AP、1つのV100 GPUで141FPSを実現しています。
論文 参考訳(メタデータ) (2023-12-12T18:55:29Z) - TAPIR: Tracking Any Point with per-frame Initialization and temporal
Refinement [64.11385310305612]
本稿では,ビデオシーケンスを通して任意の物理面上の問合せ点を効果的に追跡する,TAP(Tracking Any Point)の新しいモデルを提案する。
提案手法では,(1)他のフレームの問合せ点に対する適切な候補点マッチングを独立に特定するマッチング段階と,(2)局所的相関に基づいてトラジェクトリと問合せの両方を更新する改良段階の2段階を用いる。
結果として得られたモデルは、DAVISにおける平均約20%の絶対平均ジャカード(AJ)改善によって示されるように、TAP-Vidベンチマークにおける大きなマージンで、すべてのベースライン手法を上回ります。
論文 参考訳(メタデータ) (2023-06-14T17:07:51Z) - FastMapSVM: Classifying Complex Objects Using the FastMap Algorithm and
Support-Vector Machines [12.728875331529345]
我々は、複雑なオブジェクトを分類する新しいフレームワークであるFastMapSVMを紹介する。
FastMapSVMは、FastMapとSupport-Map Machinesの強みを組み合わせたものだ。
FastMapSVMのパフォーマンスは他の最先端のメソッドと同等であることを示す。
論文 参考訳(メタデータ) (2022-04-07T18:01:16Z) - Multiway Non-rigid Point Cloud Registration via Learned Functional Map
Synchronization [105.14877281665011]
我々は、点雲上に定義された学習関数に関する地図を同期させることにより、複数の非剛体形状を登録する新しい方法であるSyNoRiMを提案する。
提案手法は,登録精度において最先端の性能を達成できることを実証する。
論文 参考訳(メタデータ) (2021-11-25T02:37:59Z) - ASH: A Modern Framework for Parallel Spatial Hashing in 3D Perception [91.24236600199542]
ASHは、GPU上の並列空間ハッシュのためのモダンで高性能なフレームワークである。
ASHはより高いパフォーマンスを実現し、よりリッチな機能をサポートし、より少ないコード行を必要とする。
ASHとそのサンプルアプリケーションはOpen3Dでオープンソース化されている。
論文 参考訳(メタデータ) (2021-10-01T16:25:40Z) - Generic Merging of Structure from Motion Maps with a Low Memory
Footprint [3.7838598767969502]
効率的で柔軟で堅牢なマップマージを可能にする新しいツールを紹介します。
シミュレーションデータと実データ – 手持ちの携帯電話とドローンの両方から – を用いることで,提案手法の性能を検証する。
論文 参考訳(メタデータ) (2021-03-24T15:03:25Z) - Displacement-Invariant Cost Computation for Efficient Stereo Matching [122.94051630000934]
ディープラーニング手法は、前例のない不一致の精度を得ることによって、ステレオマッチングのリーダーボードを支配してきた。
しかし、その推測時間は一般的に540p画像の秒数で遅い。
本研究では,4次元特徴量を必要としないEmphdisplacement-invariant cost moduleを提案する。
論文 参考訳(メタデータ) (2020-12-01T23:58:16Z) - FarSee-Net: Real-Time Semantic Segmentation by Efficient Multi-scale
Context Aggregation and Feature Space Super-resolution [14.226301825772174]
Cascaded Factorized Atrous Space Pyramid Pooling (CF-ASPP) と呼ばれる新しい効率的なモジュールについて紹介する。
これは畳み込みニューラルネットワーク(CNN)のための軽量なカスケード構造であり、コンテキスト情報を効率的に活用する。
我々は1枚のNivida Titan X (Maxwell) GPUカードでCityscapesテストセットの84fpsで68.4% mIoUを達成した。
論文 参考訳(メタデータ) (2020-03-09T03:53:57Z) - Voxel Map for Visual SLAM [57.07800982410967]
視覚SLAMのための点を効率的にマッピングするボクセルマップ表現を提案する。
本手法は,カメラの視野に落下することを幾何的に保証し,隠蔽点を特定・除去できる。
実験結果から,我々のボクセルマップ表現は5sの地図と同等に効率的であり,EuRoCデータセット上での局所化精度(平均46%の改善)が有意に高いことがわかった。
論文 参考訳(メタデータ) (2020-03-04T18:39:14Z) - Image Matching across Wide Baselines: From Paper to Practice [80.9424750998559]
局所的な特徴とロバストな推定アルゴリズムの包括的なベンチマークを導入する。
パイプラインのモジュール構造は、さまざまなメソッドの容易な統合、構成、組み合わせを可能にします。
適切な設定で、古典的な解決策は依然として芸術の知覚された状態を上回る可能性があることを示す。
論文 参考訳(メタデータ) (2020-03-03T15:20:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。