論文の概要: Solving the Blind Perspective-n-Point Problem End-To-End With Robust
Differentiable Geometric Optimization
- arxiv url: http://arxiv.org/abs/2007.14628v2
- Date: Tue, 8 Sep 2020 02:51:35 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-05 20:29:06.936122
- Title: Solving the Blind Perspective-n-Point Problem End-To-End With Robust
Differentiable Geometric Optimization
- Title(参考訳): ロバスト微分幾何学最適化によるブラインド視点-n点問題終端問題の解法
- Authors: Dylan Campbell, Liu Liu, Stephen Gould
- Abstract要約: Blind Perspective-n-Pointは、シーンに対するカメラの位置を推定する問題である。
本稿では,視覚幾何学的問題を効果的に解くための,最初の完全エンドツーエンドのトレーニング可能なネットワークを提案する。
- 参考スコア(独自算出の注目度): 44.85008070868851
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Blind Perspective-n-Point (PnP) is the problem of estimating the position and
orientation of a camera relative to a scene, given 2D image points and 3D scene
points, without prior knowledge of the 2D-3D correspondences. Solving for pose
and correspondences simultaneously is extremely challenging since the search
space is very large. Fortunately it is a coupled problem: the pose can be found
easily given the correspondences and vice versa. Existing approaches assume
that noisy correspondences are provided, that a good pose prior is available,
or that the problem size is small. We instead propose the first fully
end-to-end trainable network for solving the blind PnP problem efficiently and
globally, that is, without the need for pose priors. We make use of recent
results in differentiating optimization problems to incorporate geometric model
fitting into an end-to-end learning framework, including Sinkhorn, RANSAC and
PnP algorithms. Our proposed approach significantly outperforms other methods
on synthetic and real data.
- Abstract(参考訳): ブラインド・パースペクティブ・オン・ポイント(Blind Perspective-n-Point, PnP)は、2D-3D対応の事前知識なく、2D画像ポイントと3Dシーンポイントを与えられたシーンに対するカメラの位置と向きを推定する問題である。
探索空間が非常に大きいため,ポーズと対応を同時に解くことは極めて困難である。
幸いなことに、これは結合した問題である: ポーズは対応が与えられ、その逆も容易に見つかる。
既存のアプローチでは、騒がしい対応が提供され、適切な姿勢が先行できる、あるいは問題のサイズが小さいと仮定している。
代わりに、視覚障害者のPnP問題を効率的かつグローバルに解決するための、最初の完全なエンドツーエンドのトレーニング可能なネットワークを提案する。
我々は、Sinkhorn、RANSAC、PnPアルゴリズムを含むエンドツーエンドの学習フレームワークに幾何モデルフィッティングを組み込むために最適化問題を微分する最近の結果を利用する。
提案手法は他の合成法や実データ法を大きく上回っている。
関連論文リスト
- A Construct-Optimize Approach to Sparse View Synthesis without Camera Pose [44.13819148680788]
カメラポーズを伴わないスパースビュー合成のための新しい構成と最適化手法を開発した。
具体的には、単分子深度と画素を3次元の世界に投影することで、解を構築する。
タンク・アンド・テンプル・アンド・スタティック・ハイクスのデータセットに3つの広い範囲のビューで結果を示す。
論文 参考訳(メタデータ) (2024-05-06T17:36:44Z) - CheckerPose: Progressive Dense Keypoint Localization for Object Pose
Estimation with Graph Neural Network [66.24726878647543]
単一のRGB画像から固い物体の6-DoFのポーズを推定することは、非常に難しい課題である。
近年の研究では、高密度対応型解の大きな可能性を示している。
そこで本研究では,CheckerPoseというポーズ推定アルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-03-29T17:30:53Z) - EPro-PnP: Generalized End-to-End Probabilistic Perspective-n-Points for
Monocular Object Pose Estimation [30.212903535850874]
Perspective-n-Pointを介して単一のRGB画像から3Dオブジェクトを配置することは、コンピュータビジョンにおける長年の問題である。
EPro-Sceneは既存の通信網を強化し、MODベースの手法とLine 6DoFのポーズ推定ベンチマークのギャップを埋める。
論文 参考訳(メタデータ) (2023-03-22T17:57:36Z) - A Solution for a Fundamental Problem of 3D Inference based on 2D
Representations [0.0]
ニューラルネットワークを用いた単眼視からの3次元推論は、コンピュータビジョンの重要な研究領域である。
本稿では,問題の重要な特別な場合に対して,2次元表現に基づく説明可能で頑健な解を提供する。
2次元画像から3次元オブジェクトのポーズ推定に関連する問題を解くために,利用可能な情報に基づく学習手法を新たに導入する。
論文 参考訳(メタデータ) (2022-11-09T05:37:01Z) - Partially calibrated semi-generalized pose from hybrid point
correspondences [68.22708881161049]
一般化カメラシステム内のカメラ構成について検討する。
実用的な解法を導出するために、異なるパラメタライゼーションと異なる解法戦略をテストする。
これらの解法は, 3次元点における雑音の存在下で, 対応する絶対ポーズ解法よりも優れた推定値が得られることを示す。
論文 参考訳(メタデータ) (2022-09-29T19:46:59Z) - Coupled Iterative Refinement for 6D Multi-Object Pose Estimation [64.7198752089041]
既知の3DオブジェクトのセットとRGBまたはRGB-Dの入力画像から、各オブジェクトの6Dポーズを検出して推定する。
我々のアプローチは、ポーズと対応を緊密に結合した方法で反復的に洗練し、アウトレーヤを動的に除去して精度を向上させる。
論文 参考訳(メタデータ) (2022-04-26T18:00:08Z) - Deep Bingham Networks: Dealing with Uncertainty and Ambiguity in Pose
Estimation [74.76155168705975]
Deep Bingham Networks (DBN)は、3Dデータに関するほぼすべての実生活アプリケーションで発生するポーズ関連の不確実性と曖昧性を扱うことができる。
DBNは、(i)異なる分布モードを生成できる多仮説予測ヘッドにより、アートダイレクトポーズ回帰ネットワークの状態を拡張する。
トレーニング中のモードや後方崩壊を回避し,数値安定性を向上させるための新しいトレーニング戦略を提案する。
論文 参考訳(メタデータ) (2020-12-20T19:20:26Z) - Learning 2D-3D Correspondences To Solve The Blind Perspective-n-Point
Problem [98.92148855291363]
本稿では、6-DoFの絶対カメラポーズ2D--3D対応を同時に解決するディープCNNモデルを提案する。
実データとシミュレーションデータの両方でテストした結果,本手法は既存手法よりも大幅に優れていた。
論文 参考訳(メタデータ) (2020-03-15T04:17:30Z) - PnP-Net: A hybrid Perspective-n-Point Network [2.66512000865131]
本稿では、ディープラーニングとモデルベースアルゴリズムを組み合わせたハイブリッドアプローチを用いて、ロバストなパースペクティブ・n・ポイント問題を考察する。
計算量の少ない合成パラメータと実世界のデータの両方を実証する。
論文 参考訳(メタデータ) (2020-03-10T10:43:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。