論文の概要: FLIGHT: Fibonacci Lattice-based Inference for Geometric Heading in real-Time
- arxiv url: http://arxiv.org/abs/2602.23115v1
- Date: Thu, 26 Feb 2026 15:27:49 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-27 18:41:22.751442
- Title: FLIGHT: Fibonacci Lattice-based Inference for Geometric Heading in real-Time
- Title(参考訳): FLIGHT: Fibonacci Lattice-based Inference for Geometric Heading in real-time
- Authors: David Dirnfeld, Fabien Delattre, Pedro Miraldo, Erik Learned-Miller,
- Abstract要約: 単眼ビデオからカメラの動きを推定することはコンピュータビジョンの基本的な問題である。
既知の回転の下でカメラの向きを回復する既存の方法は、低ノイズ、低出力条件でよく機能する傾向にある。
本稿では,カメラの向きを推定するために,単位球面上のハフ変換の新たな一般化を提案する。
- 参考スコア(独自算出の注目度): 7.517221623631364
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Estimating camera motion from monocular video is a fundamental problem in computer vision, central to tasks such as SLAM, visual odometry, and structure-from-motion. Existing methods that recover the camera's heading under known rotation, whether from an IMU or an optimization algorithm, tend to perform well in low-noise, low-outlier conditions, but often decrease in accuracy or become computationally expensive as noise and outlier levels increase. To address these limitations, we propose a novel generalization of the Hough transform on the unit sphere (S(2)) to estimate the camera's heading. First, the method extracts correspondences between two frames and generates a great circle of directions compatible with each pair of correspondences. Then, by discretizing the unit sphere using a Fibonacci lattice as bin centers, each great circle casts votes for a range of directions, ensuring that features unaffected by noise or dynamic objects vote consistently for the correct motion direction. Experimental results on three datasets demonstrate that the proposed method is on the Pareto frontier of accuracy versus efficiency. Additionally, experiments on SLAM show that the proposed method reduces RMSE by correcting the heading during camera pose initialization.
- Abstract(参考訳): 単眼ビデオからカメラの動きを推定することはコンピュータビジョンの基本的な問題であり、SLAM、ビジュアル・オドメトリー、構造からの移動といったタスクの中心となる。
IMUであろうと最適化アルゴリズムであろうと、既知の回転の下でカメラの方向を復元する既存の手法は、低雑音、低外周条件でよく機能する傾向にあるが、ノイズや外周レベルが増加するにつれて、しばしば精度が低下したり、計算コストが高くなる。
これらの制約に対処するため、カメラの向きを推定するために、単位球面(S(2))上のハフ変換の新たな一般化を提案する。
まず,2つのフレーム間の対応を抽出し,それぞれに対応する方向の大円を生成する。
そして、フィボナッチ格子をビン中心として単位球を識別することにより、各大円は様々な方向に投票を行い、ノイズや動的物体の影響を受けない特徴が正しい動き方向に対して一貫した投票を行う。
3つのデータセットに対する実験結果から,提案手法は精度対効率のParetoフロンティアにあることが示された。
さらに、SLAM実験により、カメラポーズ初期化時の方向補正によりRMSEの低減効果が示された。
関連論文リスト
- Dynamic View Synthesis from Small Camera Motion Videos [56.359460602781304]
分布に基づく奥行き正規化に基づく動的3ドルDシーンのための新しいビュー合成を提案する。
また、光線に沿った物体境界がほぼゼロとなる前に空間点の体積密度を強制する制約を導入し、我々のモデルがシーンの正確な幾何学を学べるようにした。
我々は,小さなカメラモーション入力によるシーン表現におけるアプローチの有効性を実証するために,広範囲な実験を行い,その結果を最先端の手法と比較した。
論文 参考訳(メタデータ) (2025-06-29T09:17:55Z) - ESVO2: Direct Visual-Inertial Odometry with Stereo Event Cameras [41.992980062962495]
イベントベースビジュアル・オドメトリーは、追跡とサブプロブレムのマッピング(典型的には並列)を解決することを目的としている
直接パイプライン上に,イベントベースのステレオビジュアル慣性オドメトリーシステムを構築した。
結果として得られるシステムは、現代の高解像度のイベントカメラでうまくスケールする。
論文 参考訳(メタデータ) (2024-10-12T05:35:27Z) - Detecting Rotated Objects as Gaussian Distributions and Its 3-D
Generalization [81.29406957201458]
既存の検出方法は、パラメータ化バウンディングボックス(BBox)を使用して(水平)オブジェクトをモデル化し、検出する。
このような機構は回転検出に有効な回帰損失を構築するのに基本的な限界があると主張する。
回転した物体をガウス分布としてモデル化することを提案する。
2次元から3次元へのアプローチを、方向推定を扱うアルゴリズム設計により拡張する。
論文 参考訳(メタデータ) (2022-09-22T07:50:48Z) - ParticleSfM: Exploiting Dense Point Trajectories for Localizing Moving
Cameras in the Wild [57.37891682117178]
本稿では,一対の光流からの高密度対応に基づく動画の高密度間接構造抽出手法を提案する。
不規則点軌道データを処理するために,新しいニューラルネットワークアーキテクチャを提案する。
MPIシンテルデータセットを用いた実験により,我々のシステムはより正確なカメラ軌道を生成することがわかった。
論文 参考訳(メタデータ) (2022-07-19T09:19:45Z) - Leveraging Spatial and Photometric Context for Calibrated Non-Lambertian
Photometric Stereo [61.6260594326246]
空間と測光の両方を同時に活用できる効率的な完全畳み込みアーキテクチャを提案する。
分離可能な4D畳み込みと2D熱マップを使うことで、サイズが小さくなり、効率が向上する。
論文 参考訳(メタデータ) (2021-03-22T18:06:58Z) - Calibrated and Partially Calibrated Semi-Generalized Homographies [65.29477277713205]
視点と一般化カメラから半一般化ホモグラフィーを推定するための最初の最小解を提案する。
提案した解法は、多くの合成および実世界の実験で実証されたように安定かつ効率的である。
論文 参考訳(メタデータ) (2021-03-11T08:56:24Z) - Canny-VO: Visual Odometry with RGB-D Cameras based on Geometric 3D-2D
Edge Alignment [85.32080531133799]
本稿では,自由形式の曲線登録に関する古典的な問題をレビューし,効率的なrgbdビジュアルオドメトリシステムcanny-voに適用する。
エッジ登録でよく用いられる距離変換の代替として、近似近接近傍場と配向近接近傍場という2つの方法が提案されている。
3D2Dエッジアライメントは、効率性と精度の両方の観点から、これらの代替製剤の恩恵を受けます。
論文 参考訳(メタデータ) (2020-12-15T11:42:17Z) - Monocular Rotational Odometry with Incremental Rotation Averaging and
Loop Closure [35.467052373502575]
絶対的なカメラ配向の推定は、姿勢推定タスクに不可欠である。
2D-2D機能一致だけでカメラの向きを正確に推定する高速アルゴリズムを考案する。
我々のシステムは、高速かつ一定時間反復更新のための新しいインクリメンタルローテーション平均化手法である。
論文 参考訳(メタデータ) (2020-10-05T09:19:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。