論文の概要: TriDE: Triangle-Consistent Translation Directions for Global Camera Pose Estimation
- arxiv url: http://arxiv.org/abs/2605.06889v1
- Date: Thu, 07 May 2026 19:43:15 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-11 19:43:38.585296
- Title: TriDE: Triangle-Consistent Translation Directions for Global Camera Pose Estimation
- Title(参考訳): TriDE:グローバルカメラポース推定のための三角形一貫性翻訳方向
- Authors: Francisco Chen, Yiran Wang, Yunpeng Shi,
- Abstract要約: 本稿では,高精度な高次検証信号として,カメラ三角形の整合性を利用するTriDEを提案する。
実画像グラフの実験により、TriDEは方向精度を大きなマージンで向上し、下流カメラの位置がより良くなることが示された。
- 参考スコア(独自算出の注目度): 6.2145524307257665
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Pairwise translation directions are a key input to camera location estimation in global structure-from-motion. Existing estimators usually process each image pair independently, producing directions that may be locally plausible but inconsistent with the other relative directions in the viewing graph. To jointly estimate the direction, we propose TriDE, which exploits camera-triangle consistency as an efficient higher-order verification signal. Instead of solving a costly global nonlinear optimization problem that is sensitive to initialization, TriDE refines unreliable pairwise directions through message passing between directions and their incident weighted triangles. This information propagation strategy enables us to establish a strong phase-transition bound for exact recovery under a realistic random corruption model. Experiments on real image graphs show that TriDE improves direction accuracy by a large margin and yields better downstream camera locations, providing a practical link between local pairwise estimation and global camera pose geometry.
- Abstract(参考訳): ペアワイズ変換方向は、グローバルな構造からの移動におけるカメラ位置推定へのキー入力である。
既存の推定器は通常、各画像対を独立に処理し、局所的に可視であるが、視野グラフの他の相対方向と矛盾する方向を生成する。
方向性を共同で推定するために,高次検定信号としてカメラと三角形の整合性を利用するTriDEを提案する。
初期化に敏感な大域的非線形最適化問題を解く代わりに、TriDEは、方向と入射重み付き三角形の間のメッセージパッシングを通じて、信頼できないペア方向を洗練する。
この情報伝達戦略により、現実的なランダムな汚職モデルの下で、正確な回復のための強力な位相遷移境界を確立することができる。
実画像グラフを用いた実験により、TriDEは大きなマージンで方向精度を向上し、下流カメラの位置を向上し、局所的なペアワイズ推定とグローバルカメラポーズ幾何学との実用的なリンクを提供する。
関連論文リスト
- TriP: A Triangle Puzzle Approach to Robust Translation Averaging [5.918492948669744]
本稿では,TriPを提案する。TriPはトライアングルをベースとした,ロバストな翻訳平均化のためのフレームワークである。
三角形にまたがる高次整合性を活用することにより, 提案手法は, 逆数, サイクル整合性, その他の構造的腐敗に対して頑健である。
実用面では、TriPは完全に並列化可能で、計算効率が良く、数百万台のカメラでグラフに自然にスケーラブルである。
論文 参考訳(メタデータ) (2026-05-08T02:21:51Z) - Unifying UAV Cross-View Geo-Localization via 3D Geometric Perception [51.687842983240564]
無人航空機(UAV)のクロスビューな地上局地化は、斜めのUAV画像と衛星地図との厳密な幾何学的相違により、いまだに困難である。
本稿では,3次元シーン形状を明示的にモデル化し,粗い位置認識ときめ細かなポーズ推定を統一する,幾何認識型UAV測位フレームワークを提案する。
提案手法は, 最先端のベースラインを著しく上回り, ロバストメータレベルのローカライゼーション精度を実現し, 複雑な都市環境における一般化を向上する。
論文 参考訳(メタデータ) (2026-04-02T08:08:41Z) - Geometry OR Tracker: Universal Geometric Operating Room Tracking [61.399734016038614]
手術室(OR)では、世界規模のマルチビュー3Dトラッキングは、外科医の行動認識のような下流のアプリケーションをサポートする。
カメラのキャリブレーションとRGB-Dの登録は常に信頼性が低く、幾何学的不整合が生じる。
我々は、不正確なキャリブレーションをスケール一貫性と幾何学的に整合したカメラ設定に修正する2段階パイプラインであるGeometry OR Trackerを紹介する。
論文 参考訳(メタデータ) (2026-02-28T09:21:21Z) - FLIGHT: Fibonacci Lattice-based Inference for Geometric Heading in real-Time [7.517221623631364]
単眼ビデオからカメラの動きを推定することはコンピュータビジョンの基本的な問題である。
既知の回転の下でカメラの向きを回復する既存の方法は、低ノイズ、低出力条件でよく機能する傾向にある。
本稿では,カメラの向きを推定するために,単位球面上のハフ変換の新たな一般化を提案する。
論文 参考訳(メタデータ) (2026-02-26T15:27:49Z) - TrajVG: 3D Trajectory-Coupled Visual Geometry Learning [34.47385438436523]
TrajVGは、クロスフレームな3D対応を明示する再構築フレームワークである。
擬似2次元トラックのみを用いて,同じ結合制約を自己教師対象に再構成する。
3Dトラッキング、ポーズ推定、ポイントマップ再構成、ビデオ深度による実験は、TrajVGが現在のフィードフォワードのパフォーマンスベースラインを上回っていることを示している。
論文 参考訳(メタデータ) (2026-02-04T11:13:55Z) - TALO: Pushing 3D Vision Foundation Models Towards Globally Consistent Online Reconstruction [57.46712611558817]
3次元視覚基礎モデルでは、1つのフィードフォワードパスを通して、未校正画像からキー3D属性を再構成する際の強力な一般化が示されている。
近年の戦略は,グローバルトランスフォーメーションの解決によって連続的な予測と整合するが,本分析では,仮定の妥当性,局所的なアライメント範囲,雑音的幾何の下でのロバスト性といった基本的な限界を明らかにしている。
本研究では,グローバルに伝播する制御点を利用して空間的に異なる不整合を補正する,Tin Plate Splineに基づく高DOFおよび長期アライメントフレームワークを提案する。
論文 参考訳(メタデータ) (2025-12-02T02:22:20Z) - Loc$^2$: Interpretable Cross-View Localization via Depth-Lifted Local Feature Matching [80.57282092735991]
本稿では,高精度かつ解釈可能なクロスビューローカライズ手法を提案する。
地上画像の3自由度(DoF)のポーズを、その局所的な特徴と基準空中画像とをマッチングすることによって推定する。
実験では、クロスエリアテストや未知の向きといった挑戦的なシナリオにおいて、最先端の精度を示す。
論文 参考訳(メタデータ) (2025-09-11T18:52:16Z) - Wide-Baseline Relative Camera Pose Estimation with Directional Learning [46.21836501895394]
提案するDirectionNetは,新しいパラメータ化を用いて5次元相対ポーズ空間上の離散分布を推定し,推定問題を抽出できるようにする。
本研究では,Matterport3DとInstituteNetから構築した合成・実ポーズ推定データセットについて検討した。
論文 参考訳(メタデータ) (2021-06-07T04:46:09Z) - Extreme Rotation Estimation using Dense Correlation Volumes [73.35119461422153]
本稿では,RGB画像対の相対的な3次元回転を極端に推定する手法を提案する。
画像が重なり合わなくても、それらの幾何学的関係に関して豊富な隠れた手がかりがあるかもしれないと観察する。
本稿では,2つの入力画像間の全ての点を比較することで,そのような暗黙の手がかりを自動的に学習できるネットワーク設計を提案する。
論文 参考訳(メタデータ) (2021-04-28T02:00:04Z) - Robust 6D Object Pose Estimation by Learning RGB-D Features [59.580366107770764]
本稿では、この局所最適問題を解くために、回転回帰のための離散連続的な新しい定式化を提案する。
我々はSO(3)の回転アンカーを均一にサンプリングし、各アンカーから目標への制約付き偏差を予測し、最適な予測を選択するための不確実性スコアを出力する。
LINEMOD と YCB-Video の2つのベンチマーク実験により,提案手法が最先端の手法より優れていることが示された。
論文 参考訳(メタデータ) (2020-02-29T06:24:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。