論文の概要: Relational Epipolar Graphs for Robust Relative Camera Pose Estimation
- arxiv url: http://arxiv.org/abs/2604.04554v1
- Date: Mon, 06 Apr 2026 09:29:37 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-07 15:49:19.159613
- Title: Relational Epipolar Graphs for Robust Relative Camera Pose Estimation
- Title(参考訳): リレーショナル・エピポーラグラフによるロバスト相対カメラポーズ推定
- Authors: Prateeth Rao, Sachit Rao,
- Abstract要約: Visual Simultaneous Localization and Mapping (VSLAM) の重要なコンポーネントは、一致したキーポイントを使用して相対カメラのポーズを推定することである。
本研究では, エピポーラ対応グラフ上での相対ポーズ推定を関係推論問題として再検討する。
室内および屋外のベンチマーク実験では、古典的および学習指導によるアプローチと比較して、高密度ノイズと大きなベースライン変動に対するロバスト性が改善された。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: A key component of Visual Simultaneous Localization and Mapping (VSLAM) is estimating relative camera poses using matched keypoints. Accurate estimation is challenged by noisy correspondences. Classical methods rely on stochastic hypothesis sampling and iterative estimation, while learning-based methods often lack explicit geometric structure. In this work, we reformulate relative pose estimation as a relational inference problem over epipolar correspondence graphs, where matched keypoints are nodes and nearby ones are connected by edges. Graph operations such as pruning, message passing, and pooling estimate a quaternion rotation, translation vector, and the Essential Matrix (EM). Minimizing a loss comprising (i) $\mathcal{L}_2$ differences with ground truth (GT), (ii) Frobenius norm between estimated and GT EMs, (iii) singular value differences, (iv) heading angle differences, and (v) scale differences, yields the relative pose between image pairs. The dense detector-free method LoFTR is used for matching. Experiments on indoor and outdoor benchmarks show improved robustness to dense noise and large baseline variation compared to classical and learning-guided approaches, highlighting the effectiveness of global relational consensus.
- Abstract(参考訳): Visual Simultaneous Localization and Mapping (VSLAM) の重要なコンポーネントは、一致したキーポイントを使用して相対カメラのポーズを推定することである。
正確な推定はノイズ対応によって挑戦される。
古典的手法は確率的仮説サンプリングと反復推定に頼っているが、学習に基づく手法は明示的な幾何学的構造を欠いていることが多い。
本研究では,一致したキーポイントがノードであり,近傍のキーポイントがエッジによって接続されるような,エピポーラ対応グラフ上での相対ポーズ推定を関係推論問題として再構成する。
プルーニング、メッセージパッシング、プーリングなどのグラフ操作は、四元数回転、翻訳ベクトル、および Essential Matrix (EM) を推定する。
損失の最小化
(i)$\mathcal{L}_2$相違(GT)
(II) 推定値とGT EMの間のフロベニウスノルム
(三)特異値差
(四)角度差、及び
(v)スケールの違いは、画像ペア間の相対的なポーズをもたらす。
密集検出器フリーのLoFTRはマッチングに使用される。
室内および屋外のベンチマーク実験では、古典的および学習指導によるアプローチと比較して、高密度ノイズに対する堅牢性と大きなベースライン変動が改善され、グローバルリレーショナルコンセンサスの有効性が強調された。
関連論文リスト
- Cosine-Normalized Attention for Hyperspectral Image Classification [7.170991480063844]
トランスフォーマーに基づく手法は、長距離空間スペクトル依存性をモデル化することにより、ハイパースペクトル画像分類(HSIC)を改善した。
本研究は、幾何学的視点から注目スコアを見直し、コサイン正規化注意定式化を導入する。
3つのベンチマークデータセットの実験は、提案手法が一貫して高い性能を達成することを示した。
論文 参考訳(メタデータ) (2026-04-02T08:32:12Z) - Differential pose optimization in descriptor space -- Combining Geometric and Photometric Methods for Motion Estimation [1.2977565963783035]
2フレームの相対ポーズ最適化はコンピュータビジョンの基本的な問題である。
光度誤差と再投影誤差の2つの異なる種類のエラー値が使用される。
両パラダイムの強みを統一的なアプローチに組み合わせた第3の手法について検討する。
論文 参考訳(メタデータ) (2026-02-15T20:13:29Z) - LGU-SLAM: Learnable Gaussian Uncertainty Matching with Deformable Correlation Sampling for Deep Visual SLAM [11.715999663401591]
学習可能な2次元ガウス不確実性モデルは、マッチングフレームペアを関連付けるように設計されている。
マルチスケールの変形可能な相関戦略を考案し、各方向のサンプリングを適応的に微調整する。
本手法の有効性と優位性を検証するために,実世界のデータセットと合成データセットの実験を行った。
論文 参考訳(メタデータ) (2024-10-30T17:20:08Z) - Exploiting Point-Wise Attention in 6D Object Pose Estimation Based on
Bidirectional Prediction [22.894810893732416]
本稿では,ポイントワイズ対応機構を備えた双方向対応予測ネットワークを提案する。
私たちの重要な洞察は、各モデルポイントとシーンポイントの相関が、ポイントペアマッチの学習に不可欠な情報を提供するということです。
LineMOD, YCB-Video, Occ-LineMODの公開データセットに対する実験結果から, 提案手法が他の最先端手法よりも優れた性能を実現することを示す。
論文 参考訳(メタデータ) (2023-08-16T17:13:45Z) - Learning Partial Correlation based Deep Visual Representation for Image
Classification [61.0532370259644]
CNNの新たな構造層としてスパース逆共分散推定(SICE)を定式化する。
本研究は,部分的相関に基づく深部視覚表現を求め,小さなサンプル問題を緩和する。
実験により,本モデルの有効性と優れた分類性能が示された。
論文 参考訳(メタデータ) (2023-04-23T10:09:01Z) - A Model for Multi-View Residual Covariances based on Perspective
Deformation [88.21738020902411]
マルチビューSfM, オードメトリ, SLAMセットアップにおける視覚的残差の共分散モデルの導出を行う。
我々は、合成データと実データを用いてモデルを検証し、それを光度および特徴量に基づくバンドル調整に統合する。
論文 参考訳(メタデータ) (2022-02-01T21:21:56Z) - Learning Optical Flow from a Few Matches [67.83633948984954]
密な相関体積表現は冗長であり、その中の要素のほんの一部で正確なフロー推定が達成できることを示した。
実験により,高い精度を維持しつつ計算コストとメモリ使用量を大幅に削減できることを示した。
論文 参考訳(メタデータ) (2021-04-05T21:44:00Z) - Deep Keypoint-Based Camera Pose Estimation with Geometric Constraints [80.60538408386016]
連続するフレームから相対的なカメラのポーズを推定することは、視覚計測の基本的な問題である。
本稿では,検出,特徴抽出,マッチング,外乱除去のための学習可能なモジュールで構成されるエンドツーエンドのトレーニング可能なフレームワークを提案する。
論文 参考訳(メタデータ) (2020-07-29T21:41:31Z) - Making Affine Correspondences Work in Camera Geometry Computation [62.7633180470428]
局所的な特徴は、ポイント・ツー・ポイント対応ではなく、リージョン・ツー・リージョンを提供する。
本稿では,全モデル推定パイプラインにおいて,地域間マッチングを効果的に活用するためのガイドラインを提案する。
実験により、アフィンソルバはより高速な実行時にポイントベースソルバに匹敵する精度を達成できることが示された。
論文 参考訳(メタデータ) (2020-07-20T12:07:48Z) - Deep Semantic Matching with Foreground Detection and Cycle-Consistency [103.22976097225457]
深層ネットワークに基づく弱い教師付きセマンティックマッチングに対処する。
本研究では,背景乱れの影響を抑えるために,前景領域を明示的に推定する。
複数の画像にまたがって予測変換を強制し、幾何的に可視かつ一貫したサイクル一貫性の損失を発生させる。
論文 参考訳(メタデータ) (2020-03-31T22:38:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。