論文の概要: EpiDiffVO: Geometry-Aware Epipolar Diffusion for Robust Visual Odometry
- arxiv url: http://arxiv.org/abs/2605.19556v1
- Date: Tue, 19 May 2026 08:53:26 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-20 15:03:09.217444
- Title: EpiDiffVO: Geometry-Aware Epipolar Diffusion for Robust Visual Odometry
- Title(参考訳): EpiDiffVO:ロバスト・ビジュアル・オドメトリーのための幾何学的エピポーラ拡散
- Authors: Prateeth Rao,
- Abstract要約: 画像対から相対的なポーズを推定するには、幾何学的に一貫した対応の最小限のサブセットしか必要としない。
幾何学的整合性に最適化されたコンパクトな対応セットを予測できるスパースエピポーラマッチングフレームワークを提案する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Estimating relative pose from image pairs fundamentally requires only a minimal subset of geometrically consistent correspondences. However, most learning-based approaches rely on dense matching or direct regression, leading to redundancy and reduced geometric interpretability. In this work, we propose a sparse epipolar matching framework that predicts a compact set of correspondences optimized for geometric consistency across varying temporal baselines. To address residual noise and misalignment, we introduce an epipolar diffusion process that models correspondence uncertainty and refines keypoints toward epipolar consistency. The refined correspondences, along with depth cues, are lifted into a graph representation forming a Steiner graph that encodes relational structure between points. A graph neural network learns a compact subset of informative correspondences, which are passed to a differentiable singular value decomposition solver for end-to-end geometric estimation. Relative pose is recovered from the resulting essential matrix and evaluated in a visual odometry setting on the TartanAir and KITTI SLAM datasets. Experimental results demonstrate that combining sparse matching, diffusion-based refinement, and graph-based subset selection reduces correspondence redundancy while maintaining robust pose estimation across challenging baselines.
- Abstract(参考訳): 画像対から相対的なポーズを推定するには、幾何的に一貫した対応の最小限のサブセットしか必要としない。
しかし、ほとんどの学習ベースのアプローチは密マッチングや直接回帰に依存しており、冗長性と幾何学的解釈可能性の低下につながる。
本研究では,様々な時間的基底線をまたいだ幾何的整合性に最適化されたコンパクトな対応セットを予測できるスパースエピポーラマッチングフレームワークを提案する。
残差雑音や不整合に対処するため,不整合性をモデル化し,エピポーラ整合性に向けたキーポイントを洗練するエピポーラ拡散法を提案する。
洗練された対応は深さの手がかりとともに、点間の関係構造を符号化するスタイナーグラフを形成するグラフ表現に持ち上げられる。
グラフニューラルネットワークは、情報対応のコンパクトなサブセットを学習し、それは、エンドツーエンドの幾何推定のために微分可能な特異値分解解決器に渡される。
得られた必須行列から相対的なポーズを復元し、TartanAirとKITTI SLAMデータセットの視覚的オドメトリー設定で評価する。
実験結果から,スパースマッチング,拡散ベースリファインメント,グラフベースサブセット選択の組み合わせは,難解なベースラインをまたいだ頑健なポーズ推定を維持しつつ,対応の冗長性を低下させることが示された。
関連論文リスト
- SEED: Targeted Data Selection by Weighted Independent Set [76.92528228676969]
我々はSEEDと呼ばれる堅牢でスケーラブルなデータ選択パイプラインを開発した。
SEEDは、命令チューニング、視覚的命令チューニング、セマンティックセグメンテーションにおける最先端の手法を一貫して上回っている。
論文 参考訳(メタデータ) (2026-05-15T07:26:54Z) - Robust Graph Matching through Semantic Relationship Generation for SLAM [0.15635627702544694]
Scene Graphsは、ローカルに観測されたグラフと事前マップをマッチングすることで、構造化された屋内環境のローカライズを可能にする。
本稿では,検出対象と構造要素の関係を明示的にモデル化する意味強化グラフマッチング手法を提案する。
その結果、意味的関係は、候補マッチングの数を大幅に減らし、計算効率を向上し、より高速な収束を可能にした。
論文 参考訳(メタデータ) (2026-04-28T09:15:51Z) - Relational Epipolar Graphs for Robust Relative Camera Pose Estimation [0.0]
Visual Simultaneous Localization and Mapping (VSLAM) の重要なコンポーネントは、一致したキーポイントを使用して相対カメラのポーズを推定することである。
本研究では, エピポーラ対応グラフ上での相対ポーズ推定を関係推論問題として再検討する。
室内および屋外のベンチマーク実験では、古典的および学習指導によるアプローチと比較して、高密度ノイズと大きなベースライン変動に対するロバスト性が改善された。
論文 参考訳(メタデータ) (2026-04-06T09:29:37Z) - sparseGeoHOPCA: A Geometric Solution to Sparse Higher-Order PCA Without Covariance Estimation [8.802387139798808]
本稿では,高次主成分分析(SHOPCA)のための新しいフレームワークを提案する。
本稿では,SparseGeoHOPが高次元画像設定とImageNet上でサポートされていることを示す。
論文 参考訳(メタデータ) (2025-06-10T10:30:48Z) - Last-Iterate Convergence of Adaptive Riemannian Gradient Descent for Equilibrium Computation [52.73824786627612]
本稿では,テクスト幾何学的強単調ゲームに対する新たな収束結果を確立する。
我々のキーとなる結果は、RGDがテクスト幾何学的手法で最終定位線形収束を実現することを示しています。
全体として、ユークリッド設定を超えるゲームに対して、幾何学的に非依存な最終点収束解析を初めて提示する。
論文 参考訳(メタデータ) (2023-06-29T01:20:44Z) - A2B: Anchor to Barycentric Coordinate for Robust Correspondence [25.719939636977934]
偏心座標のような幾何学的不変な座標表現は特徴間のミスマッチを著しく低減できることを示す。
本稿では,ペア画像から複数のアフィン-不変対応座標を生成する新しいアンカー-バリー中心(A2B)座標符号化手法であるDECREEを紹介する。
論文 参考訳(メタデータ) (2023-06-05T10:28:53Z) - Relative Pose from SIFT Features [50.81749304115036]
基本行列の未知元と向きとスケールに関する新しい線形制約を導出する。
提案した制約は、合成環境における多くの問題と、80000以上の画像ペア上で公開されている実世界のデータセットでテストされる。
論文 参考訳(メタデータ) (2022-03-15T14:16:39Z) - Semi-supervised Dense Keypoints Using Unlabeled Multiview Images [22.449168666514677]
本稿では,ラベルのないマルチビュー画像を用いて高密度なキーポイント検出器を学習するための,エンド・ツー・エンドの半教師付きフレームワークを提案する。
鍵となる課題は、複数のビューで密接なキーポイント間の正確な対応を見つけることである。
2つの望ましい性質を符号化する新しい確率的極性制約を導出する。
論文 参考訳(メタデータ) (2021-09-20T04:57:57Z) - Joint Network Topology Inference via Structured Fusion Regularization [70.30364652829164]
結合ネットワークトポロジ推論は、異種グラフ信号から複数のグラフラプラシア行列を学習する標準的な問題を表す。
新規な構造化融合正規化に基づく一般グラフ推定器を提案する。
提案するグラフ推定器は高い計算効率と厳密な理論保証の両方を享受できることを示す。
論文 参考訳(メタデータ) (2021-03-05T04:42:32Z) - Semiparametric Nonlinear Bipartite Graph Representation Learning with
Provable Guarantees [106.91654068632882]
半パラメトリック指数族分布におけるパラメータの統計的推定問題として、両部グラフを考察し、その表現学習問題を定式化する。
提案手法は, 地中真理付近で強い凸性を示すため, 勾配降下法が線形収束率を達成できることを示す。
我々の推定器は指数族内の任意のモデル誤特定に対して頑健であり、広範な実験で検証されている。
論文 参考訳(メタデータ) (2020-03-02T16:40:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。